multi-llm-mcp — 多LLM调用的MCP工具¶
tags: #MCP #multi-LLM #Claude-Code #Codex #Agent-orchestration source: mai-yyy/multi-llm-mcp score: 技术深度7/10 | 实用价值8/10 | 时效性8/10 | 领域匹配8/10 | 综合7.8/10
核心概念¶
一个MCP Server,让Claude Code能够调用Codex执行任务,同时支持调用多个LLM模型。Python实现,核心思路是将多个LLM provider封装为统一MCP工具接口,实现跨模型任务分发和协作。
设计原理¶
单一Agent调用多LLM的痛点¶
当前主流AI编程工具(Claude Code、Codex、OpenCode等)各自绑定单一模型。实际开发中不同任务适合不同模型: - Claude Opus/Sonnet:适合复杂推理和长上下文理解 - Codex/GPT-4o:适合代码生成和补全 - Gemini:适合长文档处理和搜索增强
multi-llm-mcp通过MCP协议将多模型调用抽象为统一工具,让Claude Code作为"主Agent"按需调度其他模型。
MCP作为多模型桥梁¶
利用MCP的标准tool-call机制:
- 定义统一的call_llm工具接口
- 参数包含目标模型、prompt、temperature等
- Claude Code通过tool_use调用其他模型,获取结果后在本地上下文中整合
关键实现¶
- 语言:Python
- Star:34(早期项目,但思路有参考价值)
- 核心功能:
- 将多个LLM封装为MCP tool
- 支持Claude Code作为主Agent调用Codex
- 统一的tool-call接口,模型切换透明
使用场景示例¶
# Claude Code通过MCP调用Codex生成代码
# tool_use: call_llm(model="codex", prompt="实现xxx函数")
# 然后在本地审查、修改生成的代码
关联分析¶
- 与 Claude-Code-Subagents-Guide 互补——subagent是进程级多Agent协作,multi-llm-mcp是tool-call级多模型协作
- 与 MCP-Tunnel 相关——MCP传输层的选择影响多模型调用的延迟
- 与 Multi-Agent-Systems-Design 相关——多LLM调度是多Agent架构的一种简化实现
- 与 MCP-Tool-Development-Best-Practices 相关——MCP工具开发的具体案例
可执行建议¶
- 在Agent项目中考虑多模型策略:不要绑定单一模型,用MCP抽象多模型调用接口,根据任务类型选择最优模型
- 成本优化思路:简单任务用便宜模型(Haiku/GPT-4o-mini),复杂推理用贵模型(Opus/GPT-5.5),通过MCP统一调度
- 参考其架构设计:即使不直接使用,"MCP工具封装多模型"的思路值得在自建Agent工具中借鉴
自评¶
| 维度 | 分数 | 权重 | 加权 |
|---|---|---|---|
| 摘要质量 | 7 | 0.25 | 1.75 |
| 技术深度 | 7 | 0.25 | 1.75 |
| 相关性 | 8 | 0.20 | 1.60 |
| 原创性 | 7 | 0.15 | 1.05 |
| 格式规范 | 9 | 0.15 | 1.35 |
| 加权总分 | 7.50 |
评分标准:摘要质量(MCP统一工具+多模型调度思路)| 技术深度(架构设计+使用场景)| 相关性(MCP+Agent开发直接相关)| 原创性(多模型成本优化建议)| 格式规范(完整标签链接评分)