Agentic Search 检索范式¶
tags: #RAG #Agentic-Search #Retrieval #Information-Extraction source: Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search score: 技术深度8/10 | 实用价值8/10 | 时效性9/10 | 领域匹配9/10 | 综合 8.5/10
核心概念¶
传统检索系统(无论是词汇匹配BM25还是语义向量检索)都将语料暴露为一个"文档接口"——返回文档列表,让下游模型去理解。这篇论文提出一个根本性转向:Agentic Search中,检索不应是"找相似文档",而应是让Agent直接与语料交互,提取结构化信息。
设计原理¶
传统RAG的瓶颈:embedding相似度 ≠ 信息相关性。一篇文档可能包含关键答案但语义上与查询不相似(例如数值数据、事实性断言)。论文提出Direct Corpus Interaction(DCI),让检索从"返回文档"变为"从语料中提取答案片段"。
Trade-off:直接语料交互的计算成本远高于向量检索(需要逐段处理),但在Agent场景中,准确性的提升可以抵消成本——因为Agent可以减少多轮检索-重试循环。
关键实现¶
- 摒弃传统的top-k文档检索 → 改为语料级别的细粒度信息提取
- Agent可以在检索过程中执行多步推理,而非一次性返回结果
- 适用于需要精确事实提取的任务(如数据分析、事实核查)
关联分析¶
- 与 Self-RAG 互补:Self-RAG让模型判断"是否需要检索",DCI重新定义"检索到的是什么"
- 对移动端AI的影响:更精准的检索意味着更少的token消耗和更低的延迟
- 可与 RAGFlow 的文档解析能力结合,提升端到端准确率
2026-06-02 更新:SAAS — 自搜索强化学习¶
论文SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation in Agentic Search提出了Agentic Search的过度搜索问题:Agent在多跳推理中容易陷入无限搜索循环,消耗大量Token却无法收敛到答案。
SAAS核心方法:通过强化学习训练Agent的自我感知能力,让Agent学会判断"当前信息是否足够回答问题",从而在适当时候停止搜索。这直接回应了Agent-Cost-Crisis-2026中讨论的成本失控问题。
同时,GrepSeek论文提出训练搜索Agent直接与语料交互(grep-style),是对DCI范式的工程化实现——将"从语料中提取"具体化为可训练的搜索行为。
可执行建议¶
- 评估当前RAG方案的检索准确率:如果top-k召回率不理想,DCI是值得尝试的替代方案
- 关注论文开源实现:如果作者释放代码,可直接替换现有RAG pipeline中的检索层
- 权衡成本:DCI适合高价值查询(如医疗、法律),对大规模低成本场景需评估ROI
自评¶
| 维度 | 分数 | 权重 | 加权 |
|---|---|---|---|
| 摘要质量 | 8 | 0.25 | 2.00 |
| 技术深度 | 8 | 0.25 | 2.00 |
| 相关性 | 9 | 0.20 | 1.80 |
| 原创性 | 7 | 0.15 | 1.05 |
| 格式规范 | 9 | 0.15 | 1.35 |
| 加权总分 | 8.20 |