跳转至

信息率失真函数⚓︎

编码效率⚓︎

编码效率,又称码率,是衡量编码方案的指标之一。若对于长度位\(k\)的序列,需要\(n\)位码长对其进行编码,则该编码方案的码率为:

\[ R=\dfrac{n}{k}. \]

失真度⚓︎

对于给定的衡量指标\(d(x,\hat{x})\),若存在常数\(D\)使得:

\[ E\left[\dfrac{1}{n}\sum_{i}^{n}d(x_i,\hat{x}_i)\right ]\leqslant D, \]

则称\(D\)为该编码方案的失真度。

常用的衡量指标包括均方差指标:

\[ d(x,\hat{x})=(x-\hat{x})^2 \]

和汉明距离:

\[ d(x,\hat{x})=\begin{cases} 0,\quad x=\hat{x}\\ 1.\quad x\neq\hat{x} \end{cases} \]

率失真函数⚓︎

定义⚓︎

对于给定的失真度\(D\),其中各种编码方案中的最小码率与\(D\)的选取存在函数关系,这个函数称为率失真函数,记作\(R(D)\)

率失真函数的性质⚓︎

单调非增性:设有一编码方案的失真度为\(D_1\),码率为\(R(D_1)\)。若取失真度\(D_2 > D_1\),则显然该编码方案也满足新的失真度要求。根据定义:\(R(D_2)\)是满足失真度要求的最小码率,因此必然有:\(R(D_2)\leqslant R(D_1)\).于是有单调不增性。

下凸函数:设有一编码方案,失真度为\(D_1\),码率为\(R(D_1)\);另一编码方案,失真度为\(D_2\),码率为\(R(D_2)\).现在对上述两方案时分(time sharing),在\(P_1\)时间内使用方案\(1\)\(P_2\)时间内使用编码方案\(2\).则新的编码方案的失真度\(P_1D_1+P_2D_2\),码率为\(P_1R(D_1)+P_2R(D_2)\).所以根据率失真函数的定义:有\(R(P_1D_1+P_2D_2)\leqslant P_1R(D_1)+P_2R(D_2)\).

率失真函数是连续函数。根据单调非增性和下凸函数性质,可以容易推断出率失真函数一定是连续函数。

率失真函数的计算⚓︎

率失真函数的表达式定义为:

\[ R(D)=\min _{p(\hat{x}\mid x)}I(X;\hat{X}). \]

并且需要满足:

\[ E[d(x,\hat{x})]\leqslant D. \]

也就是说,求解率失真函数,关键在于寻找一种后验概率分布\(p(\hat{x}\mid x)\)使得互信息最小;并且最小的互信息就是最小码率。

常见信源分布的率失真函数⚓︎

高斯信源的率失真⚓︎

信源\(X\)随机变量服从\(X\sim N(0,\sigma ^2)\)的高斯分布。选取失真度量函数\(d(x,\hat{x})=(x-\hat{x})^2\).

\[ \begin{aligned} I(X;\hat{X})&=h(X)-h(X\mid \hat{X})\\ &=h(X)-h(X-\hat{X}\mid \hat{X})\\ &\geqslant h(X)-h(X-\hat{X})\\ &\geqslant \dfrac{1}{2}\log 2\pi e\sigma ^2-\dfrac{1}{2}2\pi eE[(x-\hat{x})^2]\\ &=\dfrac{1}{2}\log \dfrac{\sigma ^2}{D}. \end{aligned} \]

关于上述推断做一些解释:计算\(h(X-\hat{X})\)时,当其为正态分布时熵最大,因此转化为求取\(D(X-\hat{X})\).由于\(D(X-\hat{X})=E[(X-\hat{X})^2]-[E(X-\hat{X})]^2\),故而有\(D(X-\hat{X})\leqslant E[(X-\hat{X})^2]\leqslant D.\)

可以验证,该极小值是取得到的,故而\(R(D)=\dfrac{1}{2}\log \dfrac{\sigma ^2}{D}\).

Bernoulli分布的率失真函数⚓︎

设信源随机变量\(X\)服从\(X\sim B(p)\)的Bernoulli分布,定义\(d(x,\hat{x})=x\oplus \hat{x}\).

根据\(E[d(x,\hat{x})]=D\)可以知道\(d(x,\hat{x})\)取1的概率为\(p(1)=D.\)于是:

\[ \begin{aligned} I(X;\hat{X})&=H(X)-H(X\mid \hat{X})\\ &=H(X)-H(X\oplus \hat{X}\mid \hat{X})\\ &\geqslant H(X)-H(X\oplus \hat{X})\\ &=H_b(p)-H_b(D). \end{aligned} \]

其中,\(H_b(\tau)=-\tau \log \tau -(1-\tau )\log (1-\tau)\).


最后更新: March 20, 2023
创建日期: March 20, 2023

评论