Skip to content

CoHyDE:LLM Agent工具检索的迭代协同训练

tags: #ToolRetrieval #LLMAgent #CoTraining #DenseEncoding source: CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval | 2026-05-31-AI论文 score: 技术深度9/10 | 实用价值8/10 | 时效性8/10 | 领域匹配9/10 | 综合 8.5/10

核心概念

LLM Agent面临的核心瓶颈之一:大规模API目录下的工具检索。当可用工具/API从几十个增长到数千个时,Agent无法有效定位正确工具。CoHyDE提出LLM Rewriter与Dense Encoder的迭代协同训练(Co-Training)机制——Rewriter改写查询使其更适合检索,Encoder学习更好的工具表示,两者交替优化形成正反馈循环。

设计原理

问题背景

Agent的工具调用流程通常为:用户意图 → 工具检索 → 工具调用。当工具目录规模增大时,检索成为瓶颈:

  • 语义鸿沟:用户查询("我想查天气")与工具描述("WeatherAPI.get_forecast(lat, lon)")之间存在语义gap
  • 工具描述多样性:不同开发者对同类工具的描述风格差异大
  • 动态工具集:工具目录持续更新,静态索引不够

CoHyDE的核心设计

借鉴HyDE(Hypothetical Document Embeddings)思路,但引入双向协同训练

  1. LLM Rewriter:将用户查询改写为"假设的工具描述",弥合查询-工具语义gap
  2. Dense Encoder:学习工具描述的高质量向量表示
  3. 迭代协同:Rewriter的输出作为Encoder的训练信号,Encoder的检索反馈指导Rewriter改进

这种设计的关键trade-off:额外训练开销 vs 检索精度提升。在工具目录>1000的场景下,精度提升显著大于训练成本。

与传统方案对比

方案 优势 劣势
关键词匹配(BM25) 简单快速 无法处理语义gap
静态Embedding 语义理解 无法适应新工具
HyDE(单向) 改写查询 Rewriter质量依赖单次训练
CoHyDE(迭代) 双向优化 训练成本较高

关键实现

  • Rewriter模块:基于LLM生成假设性工具描述,作为查询的增强表示
  • Encoder模块:双编码器架构,分别编码查询和工具描述到同一向量空间
  • 迭代训练:交替冻结一个模块训练另一个,K轮迭代(论文中K=3-5轮效果最佳)
  • 评估指标:Recall@K(特别是Recall@5和Recall@10),在ToolBench等基准上测试

关联分析

可执行建议

  1. 构建Agent时:如果工具/API目录>50个,不要用简单关键词匹配,考虑dense retrieval方案
  2. 工具描述标准化:即使不用CoHyDE,统一工具描述格式也能显著提升检索效果
  3. 评估现有方案:在项目中对当前工具检索做Recall@5评估,确定是否有优化空间
  4. 长期跟踪:CoHyDE思路可迁移到其他检索场景(代码检索、文档检索)

自评

维度 分数 权重 加权
摘要质量 8 0.25 2.00
技术深度 9 0.25 2.25
相关性 9 0.20 1.80
原创性 8 0.15 1.20
格式规范 8 0.15 1.20
加权总分 8.45

技术深度体现在对问题背景的拆解(语义鸿沟、工具描述多样性)和方案对比表。相关性高——工具检索是Agent架构的核心环节。原创性体现在trade-off分析和可迁移性建议。