信息率失真函数⚓︎

编码效率⚓︎

编码效率，又称码率，是衡量编码方案的指标之一。若对于长度位\(k\)的序列，需要\(n\)位码长对其进行编码，则该编码方案的码率为：

\[ R=\dfrac{n}{k}. \]

失真度⚓︎

对于给定的衡量指标\(d(x,\hat{x})\)，若存在常数\(D\)使得：

\[ E\left[\dfrac{1}{n}\sum_{i}^{n}d(x_i,\hat{x}_i)\right ]\leqslant D, \]

则称\(D\)为该编码方案的失真度。

常用的衡量指标包括均方差指标：

\[ d(x,\hat{x})=(x-\hat{x})^2 \]

和汉明距离：

\[ d(x,\hat{x})=\begin{cases} 0,\quad x=\hat{x}\\ 1.\quad x\neq\hat{x} \end{cases} \]

率失真函数⚓︎

定义⚓︎

对于给定的失真度\(D\)，其中各种编码方案中的最小码率与\(D\)的选取存在函数关系，这个函数称为率失真函数，记作\(R(D)\)。

率失真函数的性质⚓︎

单调非增性：设有一编码方案的失真度为\(D_1\)，码率为\(R(D_1)\)。若取失真度\(D_2 > D_1\)，则显然该编码方案也满足新的失真度要求。根据定义：\(R(D_2)\)是满足失真度要求的最小码率，因此必然有：\(R(D_2)\leqslant R(D_1)\).于是有单调不增性。

下凸函数：设有一编码方案，失真度为\(D_1\)，码率为\(R(D_1)\)；另一编码方案，失真度为\(D_2\)，码率为\(R(D_2)\).现在对上述两方案时分(time sharing)，在\(P_1\)时间内使用方案\(1\)，\(P_2\)时间内使用编码方案\(2\).则新的编码方案的失真度\(P_1D_1+P_2D_2\)，码率为\(P_1R(D_1)+P_2R(D_2)\).所以根据率失真函数的定义：有\(R(P_1D_1+P_2D_2)\leqslant P_1R(D_1)+P_2R(D_2)\).

率失真函数是连续函数。根据单调非增性和下凸函数性质，可以容易推断出率失真函数一定是连续函数。

率失真函数的计算⚓︎

率失真函数的表达式定义为：

\[ R(D)=\min _{p(\hat{x}\mid x)}I(X;\hat{X}). \]

并且需要满足：

\[ E[d(x,\hat{x})]\leqslant D. \]

也就是说，求解率失真函数，关键在于寻找一种后验概率分布\(p(\hat{x}\mid x)\)使得互信息最小；并且最小的互信息就是最小码率。

常见信源分布的率失真函数⚓︎

高斯信源的率失真⚓︎

信源\(X\)随机变量服从\(X\sim N(0,\sigma ^2)\)的高斯分布。选取失真度量函数\(d(x,\hat{x})=(x-\hat{x})^2\).

\[ \begin{aligned} I(X;\hat{X})&=h(X)-h(X\mid \hat{X})\\ &=h(X)-h(X-\hat{X}\mid \hat{X})\\ &\geqslant h(X)-h(X-\hat{X})\\ &\geqslant \dfrac{1}{2}\log 2\pi e\sigma ^2-\dfrac{1}{2}2\pi eE[(x-\hat{x})^2]\\ &=\dfrac{1}{2}\log \dfrac{\sigma ^2}{D}. \end{aligned} \]

关于上述推断做一些解释：计算\(h(X-\hat{X})\)时，当其为正态分布时熵最大，因此转化为求取\(D(X-\hat{X})\).由于\(D(X-\hat{X})=E[(X-\hat{X})^2]-[E(X-\hat{X})]^2\)，故而有\(D(X-\hat{X})\leqslant E[(X-\hat{X})^2]\leqslant D.\)

可以验证，该极小值是取得到的，故而\(R(D)=\dfrac{1}{2}\log \dfrac{\sigma ^2}{D}\).

Bernoulli分布的率失真函数⚓︎

设信源随机变量\(X\)服从\(X\sim B(p)\)的Bernoulli分布，定义\(d(x,\hat{x})=x\oplus \hat{x}\).

根据\(E[d(x,\hat{x})]=D\)可以知道\(d(x,\hat{x})\)取1的概率为\(p(1)=D.\)于是：

\[ \begin{aligned} I(X;\hat{X})&=H(X)-H(X\mid \hat{X})\\ &=H(X)-H(X\oplus \hat{X}\mid \hat{X})\\ &\geqslant H(X)-H(X\oplus \hat{X})\\ &=H_b(p)-H_b(D). \end{aligned} \]

其中，\(H_b(\tau)=-\tau \log \tau -(1-\tau )\log (1-\tau)\).

最后更新: March 20, 2023
创建日期: March 20, 2023