Skip to content

Agentic Search 检索范式

tags: #RAG #Agentic-Search #Retrieval #Information-Extraction source: Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search score: 技术深度8/10 | 实用价值8/10 | 时效性9/10 | 领域匹配9/10 | 综合 8.5/10

核心概念

传统检索系统(无论是词汇匹配BM25还是语义向量检索)都将语料暴露为一个"文档接口"——返回文档列表,让下游模型去理解。这篇论文提出一个根本性转向:Agentic Search中,检索不应是"找相似文档",而应是让Agent直接与语料交互,提取结构化信息。

设计原理

传统RAG的瓶颈:embedding相似度 ≠ 信息相关性。一篇文档可能包含关键答案但语义上与查询不相似(例如数值数据、事实性断言)。论文提出Direct Corpus Interaction(DCI),让检索从"返回文档"变为"从语料中提取答案片段"。

Trade-off:直接语料交互的计算成本远高于向量检索(需要逐段处理),但在Agent场景中,准确性的提升可以抵消成本——因为Agent可以减少多轮检索-重试循环。

关键实现

  • 摒弃传统的top-k文档检索 → 改为语料级别的细粒度信息提取
  • Agent可以在检索过程中执行多步推理,而非一次性返回结果
  • 适用于需要精确事实提取的任务(如数据分析、事实核查)

关联分析

  • Self-RAG 互补:Self-RAG让模型判断"是否需要检索",DCI重新定义"检索到的是什么"
  • 对移动端AI的影响:更精准的检索意味着更少的token消耗和更低的延迟
  • 可与 RAGFlow 的文档解析能力结合,提升端到端准确率

2026-06-02 更新:SAAS — 自搜索强化学习

论文SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation in Agentic Search提出了Agentic Search的过度搜索问题:Agent在多跳推理中容易陷入无限搜索循环,消耗大量Token却无法收敛到答案。

SAAS核心方法:通过强化学习训练Agent的自我感知能力,让Agent学会判断"当前信息是否足够回答问题",从而在适当时候停止搜索。这直接回应了Agent-Cost-Crisis-2026中讨论的成本失控问题。

同时,GrepSeek论文提出训练搜索Agent直接与语料交互(grep-style),是对DCI范式的工程化实现——将"从语料中提取"具体化为可训练的搜索行为。

可执行建议

  1. 评估当前RAG方案的检索准确率:如果top-k召回率不理想,DCI是值得尝试的替代方案
  2. 关注论文开源实现:如果作者释放代码,可直接替换现有RAG pipeline中的检索层
  3. 权衡成本:DCI适合高价值查询(如医疗、法律),对大规模低成本场景需评估ROI

自评

维度 分数 权重 加权
摘要质量 8 0.25 2.00
技术深度 8 0.25 2.00
相关性 9 0.20 1.80
原创性 7 0.15 1.05
格式规范 9 0.15 1.35
加权总分 8.20