模式矩阵 /模式白皮书/A4

A4 · Minimal Tool Set · 最简工具集

字段
双轴坐标 行动 Action × 约束 constraint(跨切,不属于任何单一拓扑)
成本档 ①(砍工具本身省 token,是净收益)
课程对应 并入 05-02
目录归属 全集 33 模式之一 · 行动模块 5 模式之一
一句话 把 agent 的工具集控制在合理上限(通常 10 到 30 个),砍掉低频、合并相似、把次要工具下沉到 sub-agent,给模型留下选择的专注力。

它解决什么问题

工具不是越多越好。某电商客服 agent 第一版抱着"能做到一切人工客服能做的事"的目标接入了 67 个工具,第一周客户满意度从 78% 掉到 51%。复盘日志里,agent 面对"我的订单什么时候到"这种简单问题,要在 14 个订单类工具里反复试错——错调三次、八秒后才给出答案,约 70% 的 thinking token 耗在工具选择上。工具列表太长,模型"看晕了"。

Minimal Tool Set 是一个反直觉的设计原则:给 agent 的工具,少而精胜过多而全。Anthropic、GitHub、Block 在 2026 年公开了同一组数据——工具数从 30 多砍到 10 左右,准确率反而提升。这件事从边际优化升级成了必修工程。

为什么坐标是「行动 × 约束」

这是本模块里唯一一个不落在具体拓扑列上的模式,需要专门说清楚。

核心机制

阈值的物理根源在 attention。Anthropic 的内部 benchmark 反复验证:单 agent 工具数超过 30 到 50 时,selection accuracy 显著下降;tool description 加起来超过约 5000 token,列表末尾的工具会出现"lost in the middle"现象,选不出来或选错。30 到 50 大致是这个 token 阈值的换算,10 到 15 是甜区。

砍工具的策略有三条:

策略 做法
删低频 30 天没被调过的工具直接 evict
合并相似 功能重叠超 50% 的工具 merge(如 query_order_detail / query_order_status / query_logistics 合成一个 query_order)
下沉次要 低频但有用的工具(OCR、PDF 解析、图片翻译)放进专门的 sub-agent

与砍工具配套的是渐进披露(progressive disclosure)。Claude Code 自己有 40 多个工具,但默认在 system prompt 里只装载 10 到 12 个,其余通过 Tool Search 按需检索加载。这是 2026 年工具管理的事实标准——核心工具常驻,扩展工具 on-demand。

适合的生产场景

什么时候不适用:任务本身极复杂的代码类 agent(Cursor、Claude Code 这类必须 30 多个工具)、以及企业多职能 agent。强行砍到 10 个反而会丢能力。

容易出错的地方

关键指标

最小骨架

prune(all_tools, stats, target_size=12):
    对每个 tool 打分 = 30天调用次数 × 成功率
    按分数降序,取前 target_size 个常驻
evict_stale(stats):
    返回 30 天调用次数为 0 的工具      # 下线候选
merge_similar(tools, threshold=0.5):
    用 embedding 算 description 相似度,>threshold 的推荐合并
# 其余工具不删除,转入 sub-agent + 挂到 Tool Search 入口

工程落地要点:core 工具 always-on,extended 工具 on-demand;按使用频次加成功率打分剪枝;保留 Tool Search 入口让罕见任务仍可达。

企业落地一例

翻译/本地化 agent 的六个决策点:核心 5 到 7 个工具撑全流程(translate / detect_lang / glossary_lookup / quality_check / format_preserve / cultural_adapt);OCR、PDF 解析、图片翻译这些低频工具下沉到专门的 sub-agent;设 30 天 evict 周期;相似工具自动提示合并;保留 Tool Search 入口让用户问罕见任务时 agent 能找到;core always-on 加 extended on-demand 的渐进披露配置。六个决策做对后,agent token 成本降约 35%、准确率升约 10 个点。回到那个电商客服案例:团队把 67 个工具砍到 18 个,一周后客户满意度回到 79%,比 67 工具的初版还高 1 个点。

与其他模式的关系

一句话记住它

最简工具集不是在裁剪工具,而是在给 agent 留下专注力——LLM 的 attention 是稀缺资源,同时打开 50 个工具就像同时开 50 个浏览器标签页,谁都没法深度思考。


本页属于 ADPS 33 模式白皮书。返回 模式矩阵与白皮书目录, 或查看配套 可运行代码目录