Information Theory and Coding
信息导论笔记,斜体部分了解即可
Chapter 1 离散信源与信息熵
概述:本章知识结构可以大致概括为:
1.信息
2.单符号离散信源
3.信息量
4.熵以及熵的性质
信息
信息定义很多,不多做赘述。
就本科目所学知识而言,信息是对不确定性的描述,不确定的东西才有研究的价值,延伸至其他领域,随机变量这一研究对象则很符合这样的“不确定性”,所以我们可以理解为信息是对随机变量不确定性的描述。
通信系统的基本模型为:信源→信源编码→加密→信道编码→信道→信道译码→解密→信源译码→信宿
我们所研究的内容以最基础的简单通信系统为例即可:
信源→信道→信宿
信源是通信系统的发射端。
信宿是通信系统的接收端。
消息是信息的载体。
信源是随机的,
信道的影响是随机的,信宿也就是随机的。
之后的内容基本上就围绕上述模型展开进行研究。
主要以香农信息论为主。
信源
前言
既然需要研究信源,则首先需要理解我们研究信源特性的动机:
※提高信源效率,尽可能使其适用于传输
※进行编码,以便“一切尽在不言中”(老师PPT里的原话,不明白啥意思😋😋😋)
信源的分类
✧离散/连续(数字/模拟)——根据信源的时间、相位、频率、幅度分布特性
✧二进制/多进制 —— 根据数字信源的消息集合大小
✧无记忆/有记忆 —— 离散信源产生的消息序列的内部关联性
✧离散/连续 & 平稳/非平稳 —— 离散信源的随机过程
单符号离散信源☜☜☜
如果信源每次发出的消息都是单一符号, 而这些符号的取值是有限或可数的,则称这种信源为单符号离散信源。(e.g. 扔骰子、普通的天气气象)
以扔骰子为例,我们可以将这一单符号离散信源表示为:
进行广义上的定义如下:
(注:此处需要概率论知识:①联合概率;②条件概率)
自信息量☜☜☜
此处有关自信息量定义过程稍微有点冗杂(其实是笔者太懒不想看),可以这样理解:消息中包含的不确定性的成分是信息,不确定性的成分越大(出现的概率越小),信息量就越大,之后我们便可以考虑这个量是多少,应该如何表示了。
基于离散信源,
①
②
③
对以上条件进行数学建模,可以得到自信息量的定义为:
根据对数底数的不同,自信息量的单位不同:
2——比特(bit)
e——奈特(nat)
10——哈特(Hart)
目前的通信系统或其他信息传输系统大多 以二进制为基础,因此信息量的单位以bit 最为常用。即:
注:此处 lb的写法是log binary
其性质按照普通对数函数结合
互信息量
之后讨论,此处不多做赘述😏😏😏。
信息熵☜☜☜
一个单符号离散信源发出的各种消息——自信息量
该信源整体的信息量如何度量——???
引入信息熵,其定义为:
可以从统计的角度出发:根据概率论的知识可知:数学期望反映了随机变量的统计特性,类比至信息量与信息熵即可理解
◼信源熵H(X)表示信源输出后,平均每个离散消息所提供的信息量。
◼ 信源熵H(X)表示信源输出前,信源的平均不确定度。
◼ 信源熵H(X)反映了变量X的随机性。
信息熵的单位为:比特/符号(bit/symbol)
其性质有:非负性、严格上凸性、最大熵定理
最大熵定理为(证明过程略,但是比较重要):
多符号离散信源☜☜☜
定义如下:如果任何时刻信源发出的消息都是有限或可数的符号序列,而每个符号都取值于同一个有限或可数的集合,则称这种信源为多符号离散信源。
(e.g. 掷多个色子,再比如发短消息,每条短消息只包含多个字)
多符号(N)离散信源发出的符号序列记为
序列中的任一符号取值于集合:
二维离散平稳信源
数学模型为:
信息熵为:
中间有一段推导过程,此处省略,最终可以得到:
其中:
通过数学方法可以证明:
如果将该信源符号所提供的平均信息量记为
多符号离散平稳信源
对于多符号离散信源发出的符号序列:
如果有两个不同的时刻k和l,其中
且概率分布相同,即:
则称该多符号离散信源为一维离散平稳信源
同时如果其二维联合概率分布也相同,即
则称该多符号离散信源为二维离散平稳信源
拓展到N维:
则称该多符号离散信源为N维离散平稳信源
注意:直到N维的各维联合概率分布都与时间起点无关。
由此得到其数学模型:
其中,
多符号离散平稳信源的信息熵
联合自信息量:
条件信息量:
信息熵:
当
多符号离散平稳无记忆信源
如果离散平稳信源发出的符号序列中各符号相互独立,则称该信源为**离散平稳无记忆信源**。
根据N维离散平稳信源数学模型:
其中,
如果各个符号相互独立,则有:
相当于一维离散平稳信源扩展N次,也叫N次扩展信源。
由此我们可以得到N维离散平稳无记忆信源数学模型:
信息熵:
平均符号熵:
极限熵:
马尔科夫(Markov)信源
如果离散平稳信源发出的符号只与前面已经发出的m(<N)个符号相关,则称该信源为m阶马尔科夫信源。
马尔科夫信源是离散平稳有限记忆信源 ,马尔科夫信源的记忆长度为 m 。
它产生的符号序列的符号之间有相关性。
数学模型为:
其中,
引入状态序列,其数学模型可以描述为:
且
此类例题一般使用状态转移图解决!!!
极限熵:
信息冗余度——懒了没看
信源符号序列分组定理——懒了没看
无失真编码定理——懒了没看
Chapter 2 无失真信源编码
前言
信息传输的3个关键要求——**效率、可靠、安全**。
信源编码:为了满足信道特性,往往需要**将n元的信源符号序列变换为m元(一般为二元)** 的信源码序列的过程。
无失真——编码和译码过程中不丢失信息。
无失真信源编码
保证符号元与码字一一对应,此时用码序列表示的信源信息熵保持不变。
例题:
最简单的无失真编码:4–2进制变换
编码的码长K=2,其编码效率为:
考虑到编码效率,此时考虑压缩比特数,进行不等长编码,即(注:下方法无法实现无失真译码):
此时一种保证符号元与码字一一对应的不等长编码为:
编码的码长:
其编码效率为:
信源二次扩展
将信源进行二维拓展组合即可。
一些小结论:
①不等长编码的平均码长可以是小数比特。
②大概率符号序列编为短码、小概率符号序列编为长码有助 于压缩平均码长。
③ 信源的N次扩展有助于压缩平均码长,随N的增大,可以预 见码率可能渐进达到信源编码的下界。
④出现无失真译码问题——由于码长不等,接收端如何从码 序列串中唯一分割出对应与每一个符号序列的码字。
无失真编码定理
一些概念
如果所采用的不等长编码使接收端能从码序列中唯一地分割出对应与每一个符号元的码字,则称该不等长编码为单义可译码。
单义可译码中,如果能在对应于每一个符号元的码字结束时立即译出的称为即时码,如果要等到对应与下一个符号元的码字才能译出的称为延时码。
e.g.
A不是单义可译码,有二义性
B是延时码
C是即时码
而考试没有码
码数图
类比二叉树,不多做赘述
克拉夫特(Kraft)不等式
m元长度为
可以这样理解,取m=2,先选取0作为其中一个码字,因为Kraft不等式表示的编码方式中每个码字长度不定,因此,每个码字不能是另一个码字的前缀。所以,当我们选取0作为一个码字后,我们就不能再将一个以0开头的二进制串作为码字。
无失真编码定理
如果
证明过程略
香农编码
香农编码的编码步骤如下:
①将符号元
②令
**③确定第
④将
霍夫曼(Huffman)编码
霍夫曼(Huffman)编码的编码步骤如下(其效率高于香农编码):
①将符号元
②为概率最小的符号元分配一个码元1, 概率次小的符号元分配一个码元0;
③将概率最小的两个符号元合并成一个新的符号元,用两者概率之和作为该新 符号元的概率;
④重复以上三个步骤,直到最后合并出一个以1为概率的符号元,结束编码。
e.g.
Chapter 3 离散信道与信道容量
互信息量
互信息量是一个随机变量包含另-个随机变量的信息量
或通过一个随机变量获取另一个随机变量所具有的信息量
它反映的也是两个随机变量间的关系;
考虑到最简单的通信系统:
信源→信道→信宿
设单符号离散信源:
单符号离散信宿:
☻如果是无噪信道,当信源发出x,信宿接收到的也必是x,因此,信道的输出y就等于输入x。
☻如果是有噪信道,信号通过信道就会产生失真,此时,信道的输出y一般不等于 输入x,但它们之间会满足一定关系, 由于噪声的随机性,用条件概率来描述这种关系是恰当的。
故**单符号离散信道的数学模型**可以表示为:
信源发出
数学关系如下:
其性质略。
无噪信道和信道中断的情况显而易见,不多做赘述。
please温习概率论当中的边缘分布知识
平均互信息量
如果将离散信道所有x对y的互信息量在联合概率空间
平均互信息量也称为交互熵,单位为bit/symbol。
以信源作为参考:
此时的条件熵
以信宿作为参考:
此时的条件熵
以系统作为参考:
性质略,但是很重要。
太懒了
注意p-I(X;Y)与q-I(X;Y)曲线的绘制
我们可以将平均互信息量理解为信道的信息传输率(不是信息传输速率)。
信道容量
定义
定义:信道转移概率分布P(Y/X)不变时,**平均互信息的最大值为信道容量**,用C表示。
其中P(X)为使I(X;Y)最大的信源概率分布。
单位是bit/symbol
顺水推舟,定义最大的信息传输速率为:
单位是bit/sec
拉格朗日极值方法计算信道容量的过程略。
计算步骤
①由
求出
②求出:
③求出:
④由
求出
均匀信道的信道容量
很重要。
对称信道的信道容量
Very important.
单符号离散信道的信道容量
とても重要です。
多符号离散信道的信道容量
Molto importante.
离散无记忆信道的信道容量
Очень важно.
Chapter 4 信道编码
前言
🥴怎样通过编码,使在信道中传输的消息发生的错误减少到可以接受的程度,进而能否实现无错误传输?🥴
纠错编码的基本思路
一个BSC的例子
设计译码规则A、B
分别求解平均错误概率
发现错误概率既与信道特性有关也与译码规则有关,故称为**译码错误概率**。
所以译码规则的设计应该依据最小错误概率准则进行。
u1s1,懒得不想看这个思路,他妈的,考试时间紧张,不多做赘述。🤡
信道编码定理
对于离散无记忆信道,如其信道容量为 C,只要信息传输率R<C,一定存在一种编码,当N足够大时,使得译码错误概率
信道编码定理指出,信道容量C是一个界限,如果信息传输率超过此界限就会出错。
但是信道编码定理没有给出编制纠错码的方法,于是就需要进行后续的讨论。
这是一个有关分类的导引
根据**纠错方式**分类:
✂检错重发(Auto Retransmission with Request, ARQ)
✂前向纠错(Forward Error Correction, FEC)
✂混合纠错 (Hybrid Error Correction, HEC)
根据**纠错码**分类:
⚔线性分组码(汉明码属于线性分组码)
⚔卷积码
⚔Turbo码
⚔LDPC码
⚔ Polar码
其中线性分组码表示为(n,k)
n为码字长度
k为信息位长度
n-k为校验位长度
这是一些重要概念的介绍
码距(汉明距离)
在
以二元码为例,码距可表示为:
其中
e.g.(1)
最小码距
在m个码字构成的码中,任意两个码字之间码距的最小值称为该码的最小距离。
编码原则是要保证最小码距足够大
错误图案
略
联合渐进均分性定理
略
费诺不等式
略
线性分组码
定义
针对码字个数为
定义码率为:
请复习线性代数向量空间的知识!!!
可参考:信道编码系列(四):线性分组码(Linear Block code)基础 - 知乎 (zhihu.com)
系统码
如果码字有两部分组成:
第一部分与输入信息序列相同(称为信息位)
第二部分为校验位
具有这个结构的码字称为系统码
线性分组码——编码
输入k位信息:
输入n长码字:
规定生成矩阵:
此时,有编码码字:
即:
码字是
线性无关矢量的线性组合
线性分组码——译码
接收码字矢量:
校验矩阵:
伴随式矢量:
校验:
纠错:
Chapter 5 连续信源
定义
如果任何是颗信源发出的消息都是单一符号,二这些服啊后的取值是连续的,则该信源位单符号连续信源。
时不变连续信源的数学模型位:
其中p(x)为概率密度函数,满足积分为1的条件.
连续信源熵(绝对熵)
微分熵(相对熵)
均匀分布连续信源的相对熵
高斯分布连续信源的相对熵
指数分布连续信源的相对熵
相对熵的性质
可加性
不具有非负性
最大相对熵定理
Chapter 6 连续信道
定义
对应于时不变连续信源和时不变连续信宿的信道为时不变连续信道。
数学模型如下:
高斯信道
定义
高斯信道的信道容量
高斯信道的最大信息传输速率
Chapter 7 信息率失真理论
太累了写不下去了,有空了会完善的。