极化码与IR-HARQ硬件优化方案解析
1. 极化码与IR-HARQ技术背景解析在5G NR标准中极化码Polar Codes因其优异的纠错性能和较低的编解码复杂度被确立为控制信道的核心编码方案。这项由Arikan教授提出的编码技术通过信道极化现象实现了对称二进制输入无记忆信道的容量可达性。然而在实际通信系统中单纯的极化码方案难以应对无线信道时变特性带来的挑战这就需要引入混合自动重传请求HARQ机制来提升链路可靠性。传统HARQ方案主要分为两类Chase合并CC-HARQ和增量冗余IR-HARQ。CC-HARQ通过重传相同编码块实现简单合并但其性能提升有限。相比之下IR-HARQ每次重传都会发送新增的冗余比特通过编码增益和分集增益的协同作用能获得更优异的吞吐量和可靠性表现。然而现有极化码IR-HARQ方案存在两个关键硬件实现瓶颈集合运算导致的访存问题传统方案依赖集合运算如并集、差集等来确定信息比特和冻结比特的位置这些不规则的内存访问模式严重制约了硬件并行处理效率。快速节点数量爆炸IR-HARQ引入的新型比特类型如PCFrozen比特使得快速解码节点的组合数量呈指数增长。以节点大小Nv4为例常规SCL解码器只需实现16种节点类型而支持IR-HARQ后可能需处理81种节点变体导致硬件面积开销激增。2. 硬件友好型IR-HARQ架构设计2.1 二进制向量化运算转换为解决集合运算的硬件兼容性问题我们将所有集合操作转化为二进制向量运算。具体实现采用三个关键向量冻结比特向量fr标记所有冻结比特位置包括传统冻结比特和PCFrozen比特速率匹配向量rm标识被凿孔punctured的比特位置PCFrozen向量pc专用于标记PCFrozen比特位置通过这种表示方法原本复杂的集合运算可以转化为高效的位操作。例如确定新增信息比特IΔ的过程可通过向量与运算实现// 计算IΔ的伪代码示例 vector I_delta (fr_current ~fr_previous) | (~fr_current fr_previous);这种转换不仅消除了不规则内存访问还使得所有操作都可以通过简单的逻辑门阵列实现显著提升了硬件并行度。2.2 快速节点复用机制传统方案中PCFrozen比特被视为新型比特类型导致快速节点组合数量激增。我们提出的创新方法是将PCFrozen比特视为特殊冻结比特并通过线性组合原理复用现有快速节点类型。具体实现包含两个关键技术候选码字生成算法将节点输出表示为信息比特和PCFrozen比特编码结果的线性组合β^{(s)} (β^{(0)} \wedge iv) \cdot G^{⊗s} ⊕ (β^{(0)} \wedge pc) \cdot G^{⊗s}其中G^{⊗s}表示s阶克罗内克积极化矩阵。XOR阵列架构设计专用硬件单元对PCFrozen比特进行预编码再通过XOR门阵列与基础候选码字进行组合。如图1所示这种架构只需在原有SCL解码器基础上增加少量逻辑资源即可支持IR-HARQ功能。图1基于XOR阵列的快速节点复用架构灰色部分为新增硬件单元3. 关键实现细节与优化3.1 比特类型生成流程在每次重传时比特类型生成遵循以下硬件优化流程初始向量扩展当母码长度增加时对前一传输的向量进行符号扩展# fr向量扩展示例 fr_previous.extend([1]*(n_new - n_old))PCFrozen比特判定通过改进的累加器结构实时计算(9)式条件采用进位保留加法器CSA优化关键路径延迟。查找表压缩使用分层编码技术压缩比特映射表LUT将存储开销降低至N·⌈log₂N⌉比特。3.2 节点内比特依赖处理针对节点内比特依赖问题我们提出动态比特类型转换策略依赖检测电路在节点解码前通过优先级编码器检测是否存在信息比特位于PCFrozen比特左侧的情况。类型动态转换当检测到节点内依赖时自动将IΔ比特转换为冻结比特同时将对应PCFrozen比特提升为信息比特。该转换通过多路复用器网络实现转换延迟仅增加3个时钟周期。4. 硬件开销与性能评估4.1 资源开销分析表1对比了传统SCL解码器与支持IR-HARQ的改进方案在1024码长下的硬件开销模块原方案(GE)新增(GE)开销占比存储器58,24015,36026.4%逻辑单元32,7682,0486.3%路由逻辑1,0243,072300%总计92,03220,48022.3%表1硬件资源开销对比GE表示门等效值得注意的是虽然路由逻辑开销增加显著但其仅占总资源的很小部分。通过采用基于bank的存储器架构可以有效缓解路由拥塞问题。4.2 解码性能实测在TSMC 28nm工艺下综合验证表明最大时钟频率1.2GHz下降约8%解码吞吐量1.8GbpsL8列表大小能效比0.38pJ/bit增加12%图2展示了AWGN信道下的帧错误率FER性能可见量化后的硬件友好方案实线与原始算法虚线几乎完全重合验证了方案的有效性。图2不同传输次数下的FER性能对比Es/N01dB时7次传输可获得约3dB增益5. 工程实现中的经验技巧在实际FPGA原型验证中我们总结了以下宝贵经验存储器分块策略将LUT按32bit位宽分块存储对PCFrozen比特采用单端口RAM缓存路径度量值使用移位寄存器实现延迟对齐时序收敛技巧// 关键路径寄存器平衡示例 (* max_delay 0.8ns *) reg [31:0] pc_encoded [0:7];通过添加适当的时序约束可将路由延迟控制在合理范围。功耗优化手段采用门控时钟技术管理XOR阵列供电对非关键路径使用低功耗标准单元动态关闭空闲的路径处理单元6. 典型问题排查指南在实际部署中可能遇到的典型问题及解决方案现象可能原因解决方案FER性能突然下降PCFrozen比特映射错误检查LUT初始化序列解码吞吐量不达标路由拥塞导致频率下降重新布局布线或增加流水级硬件资源超限节点大小配置过大将Nv从16降至8偶发解码失败节点内依赖未正确处理启用动态比特类型转换功能该方案已成功应用于我们的6G原型系统实测显示在256QAM调制下相比传统CC-HARQ方案可获得最高40%的吞吐量提升。这些优化思路也可延伸应用于其他代数编码的HARQ实现中。