别再只会用from/size了！Elasticsearch 7.6.1深度分页实战：Scroll与Search After性能对比与选型指南

张

张建站

2026/5/22 10:13:16

10分钟阅读

别再只会用from/size了！Elasticsearch 7.6.1深度分页实战：Scroll与Search After性能对比与选型指南

Elasticsearch深度分页实战Scroll与Search After性能对比与选型指南当电商平台的订单量突破千万级时后台系统经常面临这样的困境运营人员需要查询第10000条之后的订单记录进行分析传统的from/size分页要么返回空结果要么导致集群响应时间飙升到不可接受的程度。这时真正的技术决策才刚开始——如何在保证查询稳定性的同时实现高效的海量数据分页1. 深度分页的技术困局与解决方案矩阵在订单查询系统的实际压力测试中当使用from10000, size10查询时ES节点内存占用瞬间增长300MB响应时间超过8秒。这是因为传统分页方式需要全局排序后截取指定区间的数据本质上是一种全量计算局部丢弃的低效模式。深度分页的解决方案主要分为三类Scroll API适合离线批处理场景通过快照机制保持查询一致性Search After适合实时分页需求利用排序值作为游标Point in Time (PIT)ES 7.10版本特性结合了Scroll的稳定性和Search After的实时性// 传统分页的危险示例生产环境禁止使用 SearchRequest request new SearchRequest(orders); request.source().from(10000).size(10);警告在ES集群中index.max_result_window参数默认为10000超过此阈值的from/size查询将直接抛出异常。虽然可以调大该参数但会显著增加内存压力和OOM风险。2. Scroll API原理与实战优化Scroll工作机制类似于数据库游标首次查询时会创建数据快照后续通过scroll_id获取剩余批次。我们在电商日志系统中实测发现处理100万条订单数据时Scroll比from/size快15倍以上。2.1 核心操作流程初始化Scroll查询设置合理的存活时间(keep_alive)GET /orders/_search?scroll2m { size: 100, query: { match_all: {} }, sort: [_doc] # 最优性能排序方式 }使用返回的scroll_id获取下一页GET /_search/scroll { scroll: 2m, scroll_id: DXF1ZXJ5QW5kRmV0Y2gBAAAAAA... }最后必须手动清除Scroll上下文DELETE /_search/scroll { scroll_id: [DXF1ZXJ5QW5kRmV0Y2gBAAAAAA...] }2.2 性能优化关键点内存管理每个Scroll会话会在分片级别保留上下文我们建议单次scroll size控制在100-500条及时清理已完成任务的scroll_id监控nodes.stats.indices.search.open_contexts指标并行处理技巧# 多线程处理不同scroll分片的示例 from concurrent.futures import ThreadPoolExecutor def process_scroll(scroll_id): # 处理逻辑 pass with ThreadPoolExecutor(max_workers4) as executor: futures [executor.submit(process_scroll, sid) for sid in scroll_ids]## 3. Search After的实时分页实践 Search After采用记住最后一条记录的位置的思想特别适合实时更新的订单查询场景。在日均百万订单的电商平台测试中Search After的吞吐量达到Scroll的3倍。 ### 3.1 实现机制对比 | 特性 | Scroll | Search After | |---------------------|---------------------------|----------------------------| | 一致性 | 快照隔离 | 实时可见 | | 内存开销 | 高(保留上下文) | 低 | | 适用场景 | 数据导出/离线分析 | 用户实时分页 | | 排序要求 | 无特殊要求 | 必须包含唯一字段排序 | | 最大返回条数 | 无硬限制 | 受index.max_result_window影响| ### 3.2 Java API实现示例 java // 首次查询 SearchRequest request new SearchRequest(orders); SearchSourceBuilder sourceBuilder new SearchSourceBuilder(); sourceBuilder.size(100) .query(QueryBuilders.matchAllQuery()) .sort(SortBuilders.fieldSort(order_time).order(SortOrder.DESC)) .sort(SortBuilders.fieldSort(_id).order(SortOrder.ASC)); // 确保排序唯一性 SearchResponse response client.search(request, RequestOptions.DEFAULT); // 后续分页 Object[] lastSortValues response.getHits().getHits()[response.getHits().getHits().length - 1].getSortValues(); sourceBuilder.searchAfter(lastSortValues);关键细节排序字段组合必须能唯一确定文档位置通常需要包含主键或时间戳ID的组合。我们在生产环境中发现缺少唯一排序会导致约0.3%的文档重复或丢失。4. 生产环境中的陷阱与解决方案4.1 Scroll典型问题排查上下文泄漏某次大促后集群出现多个未关闭的Scroll会话导致search线程池耗尽。解决方案# 紧急清理所有scroll DELETE /_search/scroll/_all # 预防性监控脚本 curl -XGET http://localhost:9200/_nodes/stats/indices/search?pretty | grep open_contexts快照过期Scroll存活时间不足导致search_context_missing_exception。建议根据数据量设置合理的scroll时间通常每10000条数据需要1分钟实现自动续期机制while has_more_data: results get_next_scroll() if need_more_time: renew_scroll(scroll_id, 5m) # 延长5分钟4.2 Search After的排序陷阱在某次订单查询功能上线后发现分页结果出现重复文档。根本原因是排序字段不唯一导致的分页漂移。最终解决方案修改排序条件为sort: [ { create_time: desc }, { order_id: asc } ]添加查询验证逻辑if (newHits.length 0 newHits[0].getSortValues()[0].equals(lastSortValues[0])) { log.warn(Potential duplicate documents detected); }5. 性能压测数据与选型决策在32核64G的ES集群上我们对三种方案进行百万级数据测试方案QPS平均延迟内存占用适用场景建议From/Size12850ms高禁止在深度分页使用Scroll18035ms中后台报表导出、全量数据处理Search After54018ms低用户界面分页、实时查询PITSearch After51020ms低ES 7.10版本推荐方案实际项目选型时我们采用混合策略用户界面分页Search After 唯一排序保证月度报表生成Scroll 定时任务专用低优先级线程池关键业务查询PITSearch After组合ES 7.10

别再为Gurobi学术许可发愁了！手把手教你从申请到激活（附学信网报告攻略）

Gurobi学术许可全流程实战指南：从申请到Python集成第一次接触Gurobi优化求解器时，我被它强大的性能所吸引，但随即陷入了学术许可申请的迷茫中。和许多研究生同学一样，我在学信网报告下载、邮件沟通、命令行激活等环节屡屡碰壁。本…...

2026/5/20 22:04:20 阅读更多 →

Vatee：全球金融市场的可靠选择

评估一家金融服务平台的综合水准，需要从多个维度进行综合考察。Vatee在长期的运营实践中，逐步形成了具有自身特点的服务体系。本文从评测视角出发，对其在合规、技术、服务、教育等方向上的表现进行综合呈现，便于读者建立较为完整的…...

2026/5/20 22:04:12 阅读更多 →

避坑指南：展锐平台Camera驱动移植中那些容易出错的配置项（以OV08A10为例）

展锐平台Camera驱动移植实战：OV08A10关键配置避坑手册当你在展锐平台上移植OV08A10摄像头驱动时，是否遇到过这样的场景：所有配置看似正确，但摄像头就是无法正常工作？预览黑屏、图像异常或设备根本无法识别传感器——这…...

2026/5/20 22:01:58 阅读更多 →

CircuitPython嵌入式开发实战：从传感器采集到数据存储的完整方案

1. 项目概述与核心价值如果你刚开始接触嵌入式开发，面对琳琅满目的传感器、通信协议和存储需求，可能会感到无从下手。今天，我想分享一个基于CircuitPython的综合性实践项目，它串联了从模拟信号采集、数字通信到数据存储的多个核心…...

2026/5/21 12:13:15 阅读更多 →

3PEAK思瑞浦 TPA2644-TS2R TSSOP14 运算放大器

特性供电电压:3V至36V 偏移电压:2mV(最大值) 差分输入电压范围至电源轨，可作为比较器工作带宽:1.5MHz，斜率:0.5V/us 输入轨至-Vs，无内部ESD二极管至Vs 低1/f噪声:在10Hz时为50nV/Hz 高PSRR:100kHz时60dB 开关电源时无显著输出抖动工作温度…...

2026/5/21 21:54:05 阅读更多 →

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试项目地址: https://gitcode.com/gh_mirrors/wu/W…...

2026/5/21 5:13:18 阅读更多 →