极化码与概率整形融合:BICM-PS系统设计与性能优化
1. 项目概述当极化码遇见概率整形在5G标准化的激烈角逐中极化码Polar Code因其在理论上的优雅和实际中的高效最终脱颖而出成为5G新空口NR控制信道的编码方案。这标志着一个信道编码新时代的到来。然而任何一项技术都不是孤岛尤其是在追求极致频谱效率的物理层。当我们把目光投向调制领域概率整形Probabilistic Shaping, PS技术正成为提升高阶调制性能的关键钥匙。一个很自然的想法便产生了能否将这两种分别来自编码和调制领域的前沿技术结合起来产生“112”的效果这正是本文要探讨的核心。简单来说我们试图将概率整形技术“嫁接”到基于极化码的5G NR传输系统中。这并非简单的功能叠加而是涉及从比特到符号的整个处理链路的深度协同设计。其核心价值在于它允许我们在不增加发射机功率、不改变带宽的前提下通过“聪明”地分配不同调制符号的出现概率来逼近信道的容量极限从而在相同的物理资源下传输更多的有效信息或者以更低的功耗达成相同的传输可靠性。这项技术尤其适用于5G及未来通信系统中所面临的高信噪比SNR场景例如微基站密集覆盖的区域、毫米波通信链路或者光纤无线融合的前传网络。在这些场景下传统的均匀分布调制如均匀的16QAM、64QAM会浪费一部分“功率冗余”而概率整形正是用来回收这部分浪费将其转化为实实在在的吞吐量增益。接下来我将从一个实践者的角度拆解这项技术的实现原理、设计思路、实操中的关键步骤并分享在仿真和概念验证中可能遇到的“坑”与应对技巧。无论你是通信算法工程师、标准研究员还是对物理层技术有浓厚兴趣的开发者希望这篇深度解析能为你带来启发。2. 核心技术原理深度拆解要理解极化码与概率整形的结合我们必须先分别吃透这两项技术然后再看它们如何“握手”。2.1 极化码从信道合并与分裂到可靠比特的遴选极化码的发明是信息论一个里程碑式的成就。它的核心思想非常巧妙通过一种特定的“极化”变换将N个相同的独立信道转变成N个虚拟的子信道。这些子信道的特性会发生两极分化一部分子信道的容量趋近于1几乎无噪称为“好信道”另一部分子信道的容量趋近于0完全不可靠称为“坏信道”。实现这一过程的数学工具是克罗内克积Kronecker Product和递归构造。最基础的极化单元是2×2的矩阵。通过递归地将小矩阵克罗内克积我们得到了一个大的生成矩阵。编码过程可以看作是将信息比特向量乘以这个生成矩阵或等价的操作。关键在于我们只选择那些“好信道”对应的位置来放置需要传输的信息比特而在“坏信道”对应的位置放入收发双方都已知的固定值通常为0称为“冻结比特”。在5G NR标准中极化码的具体实现如编码结构、速率匹配、交织方案经过了大量的工程化优化以适配灵活多变的业务需求。对于我们的目标——结合概率整形——最需要关注的是极化码的“比特信道可靠性排序”这一特性。这个排序列表决定了在给定码长和码率下哪些位置是“好”的用于传信息哪些是“坏”的必须冻结。这个排序是后续进行概率整形映射的基础。2.2 概率整形打破均匀分布逼近香农极限传统的高阶调制如QAM默认每个符号的出现概率是相等的。但在加性高斯白噪声AWGN信道下香农公式告诉我们信道容量与输入信号的分布有关。对于平均功率受限的AWGN信道达到容量的输入信号分布是连续的高斯分布。然而数字调制使用的是离散的星座点。概率整形的目标就是让离散星座点上符号的出现概率不再均匀而是呈现出一种近似于高斯分布的形态。通常外层的、能量高的星座点被分配以较低的概率出现内层的、能量低的星座点被分配以较高的概率出现。这样在平均发射功率不变的前提下整个发射信号序列的统计特性更接近最优的高斯分布从而提升了互信息也就是提升了频谱效率。实现概率整形的关键技术是分布匹配器Distribution Matcher, DM。DM的作用是将一串均匀分布的输入比特流转换为一串具有目标非均匀概率分布的符号序列更准确地说是符号索引序列。常见的DM实现方式有常数成分分布匹配器CCDM、多集合分布匹配器MSDM等。CCDM通过枚举所有满足目标分布且总能量恒定的序列来实现是当前研究和应用中较为主流的方法。2.3 极化码与概率整形的融合架构将两者结合并非在极化编码器后简单级联一个DM。一个朴素的想法是“独立设计”先对信息比特进行极化编码再对编码后的比特进行概率整形调制。但这样做存在严重问题极化编码的输出比特是高度保护后的、近似等概的比特流直接对其整形会破坏极化码本身的纠错能力且接收端的解调与解码将变得极其复杂难以分离。因此主流的融合方案是“比特交织编码调制与概率整形”Bit-Interleaved Coded Modulation with Probabilistic Shaping, BICM-PS框架并进行深度定制。其核心思想是将概率整形过程置于信道编码之前作为“信源”处理的一部分使得最终送入调制器的符号序列满足目标分布同时保证编码器处理的仍然是经过某种变换后的二进制比特。一个典型的系统发送端处理流程如下分布匹配DM将均匀的信息比特流u通过DM生成非均匀的“整形后”的比特序列v。序列v的统计特性对应了目标星座图的概率分布。极化编码将序列v作为待编码的“信息比特”放入极化码编码器中“好信道”对应的位置。注意这里v可能不是原始信息DM过程可以看作是一种有损的预压缩/变换。速率匹配与调制映射对极化编码后的码字进行速率匹配打孔、缩短或重复然后将匹配后的比特流按一定规则映射到非均匀概率的星座图上。这里的关键在于DM和极化码的“好信道”选择需要协同设计。由于序列v的各个比特已经具有了不同的重要性它们影响着最终符号的概率我们需要将更重要的v比特放置在极化码中更可靠的“好信道”位置上。这需要对传统的极化码比特信道可靠性排序进行加权或重评估将概率整形引入的比特重要性差异作为一个新的维度考虑进去。在接收端过程相反但复杂度剧增。需要采用迭代解调解码如基于软信息的迭代来联合处理解映射和译码。解调器需要知道星座点的先验概率由DM的目标分布决定而译码器如连续消除列表译码输出的软信息又可以反馈给解调器进行下一次迭代从而逼近最优的联合检测性能。3. 系统设计与实现关键点理解了原理我们来看如何设计一个可仿真、可评估的BICM-PS极化码系统。这里我将以使用CCDM和5G NR标准极化码为例拆解几个关键模块的设计选择。3.1 目标分布与星座图设计首先需要确定概率整形的目标分布。对于方形QAM星座如64QAM、256QAM通常对同相I和正交Q两路独立地进行概率整形目标分布是麦克斯韦-玻尔兹曼Maxwell-Boltzmann, MB分布。对于一个包含M个星座点的单维度幅度集合A其概率分布为P(a) exp(-λ * a^2) / Σ exp(-λ * a^2)其中a∈Aλ是整形参数。λ的选择是第一个关键。λ0对应均匀分布。λ越大分布越“尖峰”即能量低的幅度出现概率越高整形增益越大但同时对编码和调制协同设计的要求也越高。λ的选取需要与目标码率、星座图大小进行联合优化通常通过数值搜索以最大化广义互信息GMI或实现信息速率AIR为准则。实操心得在初期仿真中不必追求最优λ。可以选取几个典型的λ值例如对应整形熵与目标码率匹配的值进行扫描。一个快速评估的方法是固定一个中等信噪比计算不同λ下无编码时BICM-PS系统的GMI选择GMI最高的λ作为起点。3.2 分布匹配器DM的实现CCDM是当前最实用的DM方案。它的输入是k个均匀比特输出是n个幅度符号来自集合A这n个符号的组成每种幅度出现的次数是固定的从而精确实现了目标分布。设计参数是块长度n和输出符号的组成。较大的n可以更精确地逼近目标分布减少速率损失但会增加处理时延和实现复杂度。对于5G NR这种对时延敏感的系统需要折衷考虑。n的选择通常在几十到几百之间。实现CCDM的核心是枚举排序Enumeration算法。给定一个由n个符号组成的、具有固定成分的序列我们需要建立它与k个信息比特之间的一一映射。这本质上是一个将组合集合进行字典序排列并建立索引的过程。在发送端我们将k比特的信息当作一个索引通过算法“枚举”出对应的唯一序列。在接收端则通过序列反查索引恢复出k比特。注意CCDM的编码和解码过程涉及大整数的运算和查找表需要仔细设计算法以避免溢出并考虑硬件实现的友好性。开源库如pyofdm或dsp-py中有CCDM的参考实现可以作为起点。3.3 极化码的协同设计这是整个系统设计的精髓所在。传统的极化码可靠性排序如5G NR使用的PW序列只考虑了信道噪声假设所有信息比特是等重要的。但在BICM-PS中DM输出的序列v的各个比特对最终系统性能的贡献度是不同的。我们需要一种“重要性感知”的比特信道排序方法。一种有效的方法是计算每个比特信道的广义互信息GMI。具体步骤是假设一个比特信道其输入是待放置的比特0或1经过后续的调制映射考虑概率整形分布后计算该比特所能达到的GMI。对所有待选的比特信道位置即极化码中可能放置信息比特的位置都计算这个GMI。按照GMI从高到低排序选择GMI最高的K个位置来放置那K个来自DM的“整形后”比特。这个计算过程是复杂的因为它依赖于调制方式、整形分布、以及该比特在调制映射中的具体位置最高有效位还是最低有效位。通常需要通过蒙特卡洛仿真或密度进化类的方法进行离线计算生成一个针对特定调制、特定分布、特定码率的“增强型”可靠性序列。实操中的简化策略在初步探索阶段可以采用一种启发式方法DM输出的前几个比特通常更重要因为它们影响幅度符号的高位。我们可以简单地将这些重要比特优先放入传统PW序列中最可靠的那些位置。虽然这不是最优的但能快速验证系统可行性并观察到一定的性能增益。3.4 接收机迭代处理流程接收机设计直接决定了系统性能的上限。一个典型的迭代接收机结构如下初始解调接收信号y基于信道估计和星座图先验概率MB分布计算每个比特的对数似然比LLR。这里的关键是准确使用先验概率。对于非均匀分布计算LLR的公式中需要包含发送符号的先验概率项。LLR(b_i) log( Σ_{x: b_i0} P(y|x) * P(x) ) - log( Σ_{x: b_i1} P(y|x) * P(x) )其中P(x)就是由DM和目标分布决定的符号概率。极化译码将计算出的LLR序列送入极化码译码器如SCL译码列表大小L8或16。译码器输出对信息比特即DM输出序列v的硬判决估计v_hat以及可能的外信息Extrinsic Information。分布匹配逆变换Inverse DM将v_hat送入逆分布匹配器尝试恢复原始均匀信息比特u_hat。如果DM设计是双射的此步骤是确定的。迭代如果进行迭代可以将极化译码器输出的外信息或经过处理的软信息反馈给解调器作为下一次解调时比特的先验信息重新计算LLR然后再次译码。通常1-2次迭代就能带来显著增益。注意事项迭代接收机大大增加了接收端的复杂度和时延。在实际系统尤其是5G NR控制信道中是否采用迭代需要慎重评估。一种折中方案是只进行“单次”但更精确的联合解调-译码例如使用因子图联合建模并通过消息传递算法一次求解。4. 性能评估与仿真实践理论分析需要仿真验证。搭建一个完整的BICM-PS极化码仿真链路是理解其性能增益和工程挑战的最佳途径。4.1 仿真链路搭建步骤参数定义确定核心参数极化码码长N如512 1024、目标码率R、调制阶数如64QAM、DM块长度n、MB分布参数λ、目标频谱效率SE R * log2(M)。离线计算根据λ和星座图计算目标MB分布。根据目标分布和n设计CCDM确定其输入比特数k有效速率 k/n。根据调制、分布和码率离线计算“重要性感知”的极化码比特信道排序序列或采用启发式规则。发送端链路生成随机均匀信息比特流u。CCDM编码将u分块每k比特通过CCDM生成n个整形后的幅度符号对应I路或Q路。合并I/Q两路得到复星座符号序列v此处v是符号索引需转换为比特形式以便编码。比特重组将DM输出的符号索引映射为比特向量准备编码。极化编码根据协同设计好的可靠性序列将上述比特向量放入极化码信息位冻结位置置0进行极化编码。速率匹配按照5G NR规则或自定义规则进行打孔/重复。调制映射将速率匹配后的比特流按照标准QAM格雷映射到星座点。注意此处的映射是均匀的概率非均匀性已由前端的DM保证。信道模拟AWGN信道添加高斯白噪声信噪比定义为Es/N0。接收端链路解调计算LLR使用包含先验概率P(x)的公式计算初始比特LLR。速率解匹配对LLR进行相应操作。极化译码使用SCL译码器进行译码输出对DM输出比特的估计。逆CCDM将译码后的比特块进行逆CCDM变换恢复原始信息比特估计u_hat。性能统计对比u和u_hat计算误块率BLER和误比特率BER。在不同Es/N0下进行蒙特卡洛仿真绘制BLER曲线。4.2 预期结果与分析将BICM-PS极化码系统与传统的“均匀分布极化码”系统进行对比你应该能观察到瀑布区左移在目标BLER如1e-2或1e-3处BICM-PS系统所需的Es/N0会更低。这个增益就是整形增益。对于64QAM在高码率下整形增益可达1 dB左右。净编码增益在相同频谱效率下比较BICM-PS系统比均匀分布系统拥有更优的BLER性能。瓶颈观察在高SNR区域均匀分布系统的BLER曲线会变平错误地板较高这是因为均匀分布调制本身存在容量损失。而BICM-PS系统的错误地板会更低因为它更接近信道容量。仿真中常见问题与排查增益不明显甚至为负检查DM速率匹配确保DM的有效速率 (k/n) 与极化码码率、调制阶数联合确定的整体频谱效率是你所期望的。一个常见的错误是DM的速率选择不当导致整体频谱效率发生变化对比不公平。检查LLR计算确保在解调器LLR计算中正确导入了符号的先验概率P(x)。这是概率整形起作用的关键。可以打印出几个LLR值与均匀分布情况下的LLR对比看其分布是否不同。检查比特映射确认从DM输出的符号到极化编码器输入比特的映射关系是清晰且一致的。发送端和接收端必须使用完全相同的映射规则。译码器性能异常检查可靠性序列如果你使用了自定义的重要性感知排序请验证其正确性。一个快速验证的方法是在极高SNR下系统应能无误码工作。如果仍有错误可能是排序错误导致重要比特被放入了不可靠信道。检查冻结比特确保冻结比特位置设置正确且收发双方使用相同的冻结比特值通常为0。迭代接收不收敛检查外信息交换确保从译码器反馈给解调器的外信息格式正确并且经过了适当的缩放阻尼因子。在初始阶段可以尝试较小的阻尼因子如0.5来保证稳定性。初始LLR准确性迭代的前提是初始解调提供的LLR质量足够好。如果初始LLR偏差太大迭代可能无法纠正。可以尝试提高第一次解调时的先验信息置信度。5. 工程化挑战与未来展望将实验室的仿真性能转化为实际芯片或软件中的增益面临着诸多挑战。1. 复杂度与延迟DM复杂度CCDM的枚举算法涉及大数运算和存储对于高速数据流如5G eMBB业务是巨大的挑战。需要研究低复杂度、低延迟的DM结构如串行操作的DM或使用查找表与流水线结合的设计。协同设计排序重要性感知的可靠性排序需要针对不同的码率、调制方式、整形参数进行预计算并存储增加了存储开销。需要研究自适应或参数化的简化排序算法。迭代接收迭代处理显著增加接收机延迟和功耗在控制信道等对时延极其敏感的场景可能无法接受。需要研究性能与复杂度折中的非迭代联合检测译码算法。2. 标准化与兼容性5G NR Release-15/16的标准已经冻结极化码方案是确定的。引入概率整形意味着对现有物理层处理链路的修改。如何以最小的改动、后向兼容的方式引入PS是一个重要的工程课题。一种思路是将PS作为链路自适应的一部分仅在信道条件好高SNR且业务需求高吞吐量时启用。3. 自适应技术理想的系统应该能根据实时的信道状态信息CSI和业务需求自适应地调整整形参数λ、调制阶数和码率。这需要一套高效的联合自适应算法和信令反馈机制。我个人在实际研究和仿真中的体会是极化码与概率整形的结合代表了物理层设计从“模块化堆叠”走向“跨层深度协同”的趋势。它要求算法工程师不能只盯着编码或调制一个盒子而必须通盘考虑从比特到波形整个链路的联合优化。虽然目前这项技术主要停留在学术研究和原型验证阶段但其展现的潜力是明确的。随着芯片算力的持续提升和未来通信系统如6G对峰值速率与能效比的极致追求这种深度协同的技术路径很可能从备选方案变成必选项。对于想要进入这一领域的朋友我的建议是从扎实的仿真开始。不要急于求成去复现最复杂的系统。可以先在简单的AWGN信道下实现一个固定参数的BICM-PS链路亲手调试出那1dB的增益。这个过程会让你对分布匹配、LLR计算、联合设计等概念有血肉般的深刻理解。然后再逐步挑战更真实的信道模型、更低的复杂度算法和硬件友好的设计。这个领域依然有很多从理论走向实践的精彩问题等待解决。