LLM的重复性生成问题,也常被称为“循环”或“复读机”问题,是解码过程中一个常见的失败模式。这不仅影响文本质量,也暴露了模型在保持生成长文本一致性和多样性方面的弱点。根据我的经验和理解,缓解这个问题需要一个多层次的方法,从解码策略调整到模型层面的干预,再到系统设计。下面我将系统地阐述。1. 解码阶段:调整生成策略(最直接、最常用)这是在推理阶段,无需改动模型本身即可采取的措施。调整采样温度:机理:Temperature参数用于控制输出概率分布的平滑程度。操作:温度 1:使概率分布更“尖锐”,模型更倾向于选择高概率词。但过低的温度会加剧重复,因为模型会固执地选择那几个最安全的词。温度 1:使概率分布更“平缓”,低概率词也有机会被选中。适当提高温度(如0.7~0.9)是缓解重复的有效手段,因为它引入了更多的