RRF和Cross-Encoder rerank怎么实现

张

张建站

2026/5/13 15:23:42

10分钟阅读

很好这两个东西基本就是现代 RAG 检索系统的“标配升级”。我给你直接讲清楚RRF 是融合算法Cross-Encoder 是重排序模型两者通常一起用先召回再精排我分开讲并给你可直接用的实现方式。一、RRFReciprocal Rank Fusion 它解决什么问题当你有多个检索器比如BM25 排名Embedding 排名它们的分数尺度不同不能直接相加。RRF 的思路是不看分数只看“排名” RRF 公式对每个文档[score \sum \frac{1}{k rank}]通常k 60常用经验值意思是排名越靠前 → 得分越高排名越靠后 → 影响迅速变小为什么它好优点不需要统一分数非常稳定工业界常用对异常值不敏感 RRF 实现示例假设你已经有bm25_results[doc_id1,doc_id2,...]emb_results[doc_id3,doc_id2,...]实现fromcollectionsimportdefaultdictdefrrf_fusion(rank_lists,k60): rank_lists: List of ranked lists scoresdefaultdict(float)forrank_listinrank_lists:forrank,doc_idinenumerate(rank_list):scores[doc_id]1/(krank1)# 按分数排序returnsorted(scores.items(),keylambdax:x[1],reverseTrue)使用final_resultsrrf_fusion([bm25_top,embedding_top])二、Cross-Encoder Rerank这是更高级的。它和普通 embedding 有什么区别Bi-Encoder普通 embeddingquery → 向量 doc → 向量然后算相似度。优点快可预计算可扩展缺点语义粗糙Cross-Encoder它是[query doc] 一起输入模型模型直接输出这个文档和 query 的相关性分数它会看到完整上下文做深度交互效果远好于 embedding但不能预计算速度慢只能用于 rerank Cross-Encoder 实现用 sentence-transformerspipinstallsentence-transformers示例代码fromsentence_transformersimportCrossEncoder# 加载模型modelCrossEncoder(cross-encoder/ms-marco-MiniLM-L-6-v2)defcross_rerank(query,documents):pairs[(query,doc)fordocindocuments]scoresmodel.predict(pairs)rankedsorted(zip(documents,scores),keylambdax:x[1],reverseTrue)returnranked 使用方式标准流程第一步召回快BM25 Embedding 取 Top 50第二步Cross-Encoder 精排top_candidates[...]final_rankedcross_rerank(query,top_candidates)三、工业标准架构现在主流系统是1️⃣ BM25 召回 100 2️⃣ Embedding 召回 100 3️⃣ RRF 融合 4️⃣ 取 Top 20 5️⃣ Cross-Encoder 重排 6️⃣ 取 Top 5 7️⃣ 交给 LLM这是非常成熟的结构。四、RRF vs Cross-Encoder 区别项目RRFCross-Encoder类型融合算法深度模型是否需要训练不需要需要预训练是否慢很快较慢精度中等很高用途融合多检索器精排五、推荐你怎么做如果你做代码检索Bug 分析RAG 系统建议结构BM25 Embedding ↓ RRF ↓ Cross-Encoder ↓ LLM六、性能建议RRF 用在前面Cross-Encoder 只对少量候选20~50条不要对全库用 Cross-Encoder太慢

从理论到硬件：卷积码与维特比译码的FPGA实现全解析

1. 卷积码与维特比译码的基础原理第一次接触卷积码时，我被它的精妙设计所震撼。想象一下，你正在用对讲机和朋友通话，但周围充斥着各种干扰噪音。卷积码就像一位细心的邮差，不仅传递你的原始信息，还会额外附上几张&qu…...

2026/5/13 15:23:22 阅读更多 →

数字IC设计中的“半周期路径”到底是什么？一个时序图帮你彻底搞懂Setup/Hold检查

数字IC设计中的“半周期路径”可视化解析：从波形图透视Setup/Hold检查本质在数字集成电路设计的时序验证领域，"半周期路径"（Half Cycle Path）是一个让许多初学者既熟悉又陌生的概念。熟悉是因为它频繁出现在静态时序分…...

2026/5/13 15:23:19 阅读更多 →

题解：学而思编程合理分工

欢迎大家订阅我的专栏：算法题解：C与Python实现！ 本专栏旨在帮助大家从基础到进阶 ，逐步提升编程能力，助力信息学竞赛备战！ 专栏特色 1.经典算法练习：根据信息学竞赛大纲，精心挑选…...

2026/5/13 15:21:01 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/12 23:12:06 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/13 15:11:14 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/12 17:56:15 阅读更多 →