RAG 系列（十二）：高级分块策略——Parent-Child 与 Contextual Retrieval

张

张建站

2026/5/10 19:01:03

10分钟阅读

RAG 系列（十二）：高级分块策略——Parent-Child 与 Contextual Retrieval

分块的两难困境RAG 系统里有一个经典矛盾：Chunk 太小：向量匹配精准，但返回给 LLM 的内容是片段，缺乏上下文，无法完整回答问题Chunk 太大：内容完整，但语义太分散，embedding 质量下降，检索命中率降低这不是调参能解决的问题，而是 Naive 分块的结构性缺陷。小块适合检索，大块适合生成——这两个需求本来就是矛盾的，用同一个尺寸的 chunk 同时满足两者，必然顾此失彼。本篇介绍两种突破这一困境的方案：Parent-Child Chunking：用小块做检索，命中后返回对应的大块Contextual Retrieval（Anthropic 方案）：给每个 Chunk 加上文档上下文描述，让 embedding 更"聪明"Parent-Child Chunking核心思路索引阶段：父文档（800字）→ 存储在 docstore（InMemoryStore） ↓ 切割子 Chunk（200字）→ 存入向量库检索阶段： query → 向量检索匹配子 Chunk（精准） → 找到子 Chunk 对应的父文档 → 返回父文档给 LLM（完整）检索用的是小 chunk，LLM 拿到的是大 chunk。两个需求，各自最优，互不干扰。代码实现LangChain 的ParentDocumentRetriever封装了这个逻辑：fromlangchain_classic.retrieversimportParentDocumentRetrieverfromlangchain_classic.storageimportInMemoryStorefromlangchain_text_splittersimportRecursiveCharacterTextSplitter child_splitter=RecursiveCharacterTextSplitter(chunk_size=200,# 小块：用于向量检索chunk_overlap=20,)parent_splitter=RecursiveCharacterTextSplitter(chunk_size=800,# 大块：命中后返回给 LLMchunk_overlap=50,)vectorstore=Chroma(collection_name="parent_child",embedding_function=embeddings)store=InMemoryStore()# 存储父文档的 docstoreretriever

桌面应用太臃肿？zero-native：轻量级 Zig 原生外壳，解决跨平台开发的体积焦虑！

前端技术向桌面端渗透，这倒也算不得什么新鲜的野心。早年间用 Electron 套个壳，前端代码原封不动搬上去，也就成了一个能独立运行的桌面软件。跨平台的红利固然诱人；代价却也十分具体——十几二十年前的桌面软件，开发者…...

2026/5/10 18:55:30 阅读更多 →

三大技术挑战：如何高效处理加密流媒体视频？

三大技术挑战：如何高效处理加密流媒体视频？ 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL-RE …...

2026/5/10 18:55:29 阅读更多 →

构建AI增强的第二大脑：从知识管理到智能创造的实战指南

1. 项目概述：构建你的第二大脑AI助手在信息爆炸的时代，我们每天都在被海量的文章、播客、笔记和想法淹没。你有没有过这样的经历：明明记得读过一篇非常有洞见的文章，但需要用到时却怎么也想不起具体内容，甚至连标题都…...

2026/5/10 18:52:52 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/10 0:01:34 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/10 0:10:18 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/10 0:14:33 阅读更多 →