位置: 首页 > 公理定理

香农三大定理的理解-香农三大定理理解

作者:佚名
|
3人看过
发布时间:2026-06-08 21:42:15
我当年第一次听香农那个发布会的标题时,脑子一时没转过来。那是 1948 年 6 月 3 号,他在斯坦福大学的伊利诺伊语实验室里,对着麦克风说:“最优信息传输速率,能够用带宽乘以对数来算。”那时候大家脑
我当年第一次听香农那个发布会的标题时,脑子一时没转过来。
那是 1948 年 6 月 3 号,他在斯坦福大学的伊利诺伊语实验室里,对着麦克风说:“最优信息传输速率,能够用带宽乘以对数来算。”那时候大家脑子里全是二进制,0 和 1,黑色和白色,只有那几套算法,要么是做加法,要么是搞卷积,要么是套个公式去算。香农这话说得跟咱们目前不一样,他脑子里装的不是二进制,是信息本身。他说的不是比特,不是比特的多少,而是“信息”这个概念。 说到信息,最让人头疼的就是那个“熵”。在咱们日常聊天里,熵听起来像是一个物理量,像是一个温度计,要么一个熵值计算得准不准。但在信息论里,熵就是混乱度的度量。
要是你家里乱得像鸡窝,你数到第几根头发就能把那个乱糟糟的场景还原出来,那这个场景的熵就挺大。但要是家里井井有条,文件都归档分类好,哪位都能瞬间说出文件名,那这个场景的熵就挺小。香农证明白,甭管你如何压缩数据,你一辈子无法让一个系统的熵低于它本身的初始熵。
这仿佛有点反直觉,出于大家平时都认定压缩不就是让东西更“有序”吗?实际上不然。压缩算法就像是在打乱一个系统的秩序,它强行把信息打散,塞进到低的噪声里。你拉链一拉开,那些已经被压缩得乱七八糟的符号瞬间又变回来了。你脑子里当作压缩后的信息少了,但香农说的是,信息的总量没变,只是它的“熵”降下来了。就像你手里攥着一把乱码,大家认定你手里的东西稀松松的,但要是你把这些乱码重组起来,那这些乱码里可能包含了贼复杂的逻辑关系。香农的定理告诉我们,信息论不是研究如何把信息压缩得更少,而是研究如何把信息传输得更稳。 这个定理最让人震撼的地方在于它揭示了一个根本性的限制:带宽无法无限增添,没有空气就是没有流量。
不要当作只要带宽够宽,流量就能无限大。香农的公式 $C = B log_2(1+S/N)$ 里,那个对数项里有个 $log_2$,这听起来挺玄乎。
为啥是 2 次方?出于信息论的基石就是比特。人类交流的颗粒度,信息的单位就是 0 和 1,没有 2 就构不成信息。
这个公式的意思是,你能传输多少信息,取决于你有多少带宽,也取决于信噪比。信噪比越高,也就是背景噪音越小,你传输的信息就越多。
这不只是是工程上的限制,更是物理世界的硬约束。 我认定这个定理最妙的地方在于它的边界条件。在大量工程场景里,我们总认定带宽无限,信号无限强,最终就能传输无限的数据。
实际上不然,香农定理划出的那条线,就是信息传输的绝对极限。
这个极限不是数字 10 要么 2000 之类的,而是跟比特相关。
比如一个 32 位的系统,带宽越大,传输的比特数就越多,但实际能承载的“信息量”增量是固定的。
要是网络带宽够大,但每个粒子的信息量不足以构成有意义的比特,那这就是在传输噪声,而不是有效信息。
这就好比在一条挺宽的河上开车,河面越宽,你开的速度能够越快,但你能塞进多少车,取决于每辆车能装多少货。香农定理告诉我们,那个“每车能装多少货”的极限,就是 $log_2(text{有效比特数})$。 为了把那个 $log_2$ 里的底数搞懂,我们能够看看一个具体的例子。假设我们想要传输 $10^7$ 个比特的数据。
要是你用 10 位二进制串来传输,那你得传输 $10^7$ 个 0 和 1,一共 $10^7$ 个字符。
要是只用 4 位二进制串,你得传输 $10^7 times 2.32$ 个字符。
要是只用 1 位呢?你得传输 $10^7$ 个 0 和 $10^7$ 个 1。
这时候,要是我们把传输的字符数无限压缩,直到某个符号无限接近 0 的概率,那理论上的极限是多少?香农定理告诉我们,当信噪比趋近于无穷大,要么当数字量无限大时,有效比特数的增长速率会是 $log_2(text{数字量})$。
这个 $log_2$ 的底数 2,直接拍板了信息量的单位。
要是我们用 10 位来算,哪怕带宽再宽,信息量的增长率也是 $log_{10}(text{数字量}) times log_2(10)$。
这就是香农定理里那个“对数”的魔力,它不只是是一个数学工具,它是连接物理世界(比特、0 和 1)和人类认知(信息、语言、逻辑)的桥梁。 这个定理对目前的我们来说,意义可能比当年听起来要深得多。我们每天看视频,视频压缩得再了得,实际上它只是把视频的熵降下来了,并没有削减视频里包含的总信息量。
你看,那些被压缩后的数据,当你解码的时候,原来的复杂关系又回来了。香农定理告诉我们,我们一辈子无法消除数据背后的信息熵。
这不仅是网络传输的极限,也是加密算法的底线。你加密了一个文件,把它的熵降到了零,那它就不算加密了,它只是被替换了。真正的保险,不是让数据看起来是乱的,而是让攻击者无法从混乱中恢复出清楚的含义。 最终我想说,香农并没有说“一定要用 2 次方”。他只是一个定义了信息的单位。
要是未来有人发明白用 3 次方要么 4 次方来定义信息量,那信息论的框架就得变了。
关键在于那个 $log$ 的底数,还有带宽和信噪比这两大要素如何在物理世界中被体现。抖音、微信、流媒体这些看似无限压缩的技术,背后实际上是无数次的熵减过程。但不管技术如何变,香农的那条线一直在那里,那条线就是信息无法被无限压缩的边界。
这也解释了为啥我们在追求更高的传输速率时,有时候会遇到瓶颈,出于有时候瓶颈不是带宽不够,而是信息本身变得忒复杂,以至于无法在有限的比特里表达。
这就是香农留给我们的最深刻的遗产:信息论不是一堆公式,它是人类理解世界如何被记录、被传递、被理解的终极法则。
推荐文章
相关文章
推荐URL
Hahn 定理这东西,听着挺学术,实际上说白了就是个“只有坏才抓不到,好人全抓了”的判定器。在函数分析的这片泥潭里,它算是个活化石,别看年轻时候被拉去修修补补,目前又出于那个著名的正交多项式难题上了热
2026-06-05
22 人看过
我走不进去那个门了,要么说,我进了,但就是转不过弯。就像这大模型,它能把文书改得跟印刷厂传过来的稿子一模一样,就连还能把那种老旧的公文格式硬生生塞进现代网页里,但它就是没法真正“看懂”人心里那点没明说
2026-06-08
4 人看过
一个关于“看不见”的数学直觉 雷布钦斯基定理,听起来像是个冷冰冰的代数公式,但在几何的世界里,它实际上藏着一种让人头皮发麻的“直观”力场。想象一下你在二维平面上画两条线,一条是直线 $y = ax
2026-06-09
4 人看过
在聊聊那些让人头大又头疼的“平面平行”难题时,我脑子里蹦出来的第一个想法往往就是:别急,先别急着把那些教科书上死记硬背的定理所数落一遍。那些“要是两条直线同在一个平面内……"、“若两直线分别与第三条直
2026-06-06
4 人看过