28 模式矩阵
7 × 6 的 Agent 架构框架。
模型在花钱,Harness 在控预算。这套目录就是你明天可以直接用进项目里的词汇表。
大部分"Agent 架构"指南给的都是一张平铺的清单——Reflection、ReAct、Multi-Agent、Tree of Thoughts、 Reflexive Metacognitive,等等。平铺清单回答的是有哪些模式。它不回答我的问题坐落在哪里、 那个坐标上住着哪个模式。
一个贷款评估 Agent 崩掉,不是因为缺了 Reflection,而是因为 Perception 阶段的预算分配把那份 disqualifying 文档丢了。一个多 Agent 代码评审系统漂移,不是因为 ReAct 错了,而是因为 Collaboration 拓扑没有冲突解决机制,导致互相矛盾的编辑不断累积。知道失败发生在哪条轴上, 比知道失败模式叫什么更重要。
02-03)对应《Designing AI Agents》中介绍该模式的章节。
两条轴
认知功能(行)——Agent 在做什么类型的工作。7 类: 感知、记忆、推理、行动、反思、协作、治理。
执行拓扑(列)——工作长什么形状。6 类: 链式、路由、并行、编排、循环、层级。
两轴相交,形成 7×6 = 42 格的矩阵。其中 28 格落有命名模式——一部分借自已有文献 (RAG、思维链、规划执行),一部分是为之前无名的格子在本框架里第一次命名(上下文分诊、 失败日记、可观测性等)。剩下的 14 格是有意空白的,代表工业空白和未来研究的前沿。
模式矩阵白皮书 · 28 核心 + 5 扩展 = 33
双轴框架的 28 个核心模式构成课程版矩阵;另有 5 个扩展模式(M5 程序性记忆 · R5 双模架构 · A4 最简工具集 · C5 子代理隔离 · G4 钩子流水线——教学时并入相邻讲,白皮书单独成篇),合为 33 篇全集。下方按 7 个认知功能分组,扩展模式标 扩展。
矩阵里的每一格,背后都有一页企业级说明文档:它解决什么问题、什么时候该用、哪里容易出错、上线后看哪些指标。 面向产品、架构、研发、合规、管理各类角色——不是实践课程,而是可以直接拿去对齐团队的干净技术参考。
感知 Perception · 4 核心
- P1 · 上下文分诊 — 候选信息总量超出 context 窗口预算时,决定谁先进、谁等门外、谁压根不预加载。
- P2 · 语义压缩 — Agent 跑久了 context 装满,得压;压的时候保留什么、丢什么、保到什么程度,决定它接下来还能不能想清楚。
- P3 · 渐进发现 — Agent 面对陌生信息空间且不知道相关信息在哪时,先看一眼再决定钻多深,通过广扫→精读→深追三阶段循环把它探明白。
- P4 · 多模态融合 — Agent 接到的输入有图、有文、有表、有日志,把每一种转换成最适合 LLM 消化的形态,再合并喂给推理层。
记忆 Memory · 4 核心 + 1 扩展
- M1 · 分层保留 — 把 agent 的记忆按作用域切成多层,每层独立存储、独立生命周期、独立加载策略,新会话从粗到细加载。
- M2 · 检索增强生成 — 给 agent 配一个外挂图书馆,让它在每次需要超出 context 容量的知识时,能查、能筛、能迭代地查回来用。
- M3 · 进度追踪 — Agent 在长任务中显式维护一份结构化的 todo list,每一轮把状态外部化,让 agent 自己和用户都能看见做到哪了。
- M4 · 失败日记 — Agent 把每次失败结构化记录(哪一步失败、什么错、根因、怎么补救),跨任务持久化,下次类似情况主动召回。
- M5 · 程序性记忆 扩展 — 把一类任务的成功执行流程凝固成可命名、可加载、可复用的结构化资产,下次同类任务直接调用,跳过试错进入主路。
推理 Reasoning · 4 核心 + 1 扩展
- R1 · 思维链 — 把模型的推理过程显性化成一段可存储、可审计、可跨模型迁移的结构化数据,让"为什么得出这个结论"有据可查。
- R2 · 复杂度路由 — 在查询进入主循环之前按复杂度信号选模型加 effort 档位,让简单查询走便宜模型、复杂查询才用贵模型,用分流换账单。
- R3 · 并行探索 — 同一个查询内故意启动 N 条独立推理链,再用聚合策略合成单一答案,用算力换准确度。
- R4 · 迭代假设验证 — Agent 形成假设、用证据验证、根据结果修正,循环到证据收敛或达到迭代上限,把科学方法搬进推理。
- R5 · 双模架构 扩展 — 把 Agent 拆成快而浅的 Talker 和慢而深的 Reasoner,通过共享 belief state 协同,让 Agent 在深度思考的同时还能即时跟用户说话。
行动 Action · 4 核心 + 1 扩展
- A1 · 工具调度 — Agent 在每一步行动前,由工程层依据工具元数据从工具集中挑出最合适的工具,而不是让模型自己临场决定。
- A2 · 规划执行 — Agent 先生成完整 plan(含依赖结构、资源预估、审批节点),再按 plan 执行,遇到偏离时局部 replan 而非全局重写。
- A3 · 提示链 — 把一个复杂任务拆成一串小任务,每一步用一段独立的 prompt 跑,前一步的输出作为下一步的输入,串起来完成。
- A4 · 最简工具集 扩展 — 把 agent 的工具集控制在合理上限(通常 10 到 30 个),砍掉低频、合并相似、把次要工具下沉到 sub-agent,给模型留下选择的专注力。
- A5 · 守卫三明治 — 在 agent 每个有副作用或高风险的动作前后套上 pre-check 和 post-check 夹层,把它从"自由行动"约束到"被监督的行动"。
反思 Reflection · 4 核心
- F1 · 生成批评 — 一个 agent 内置两个角色,Generator 写、Critic 评,循环改进直到 critic 通过或达到迭代上限。
- F2 · 技能包 — 把反复成功的工作流封装成可命名、可加载、可复用的结构化资产,下次同类任务直接调用而非从零摸索。
- F3 · 经验回放 — agent 在新任务来时主动检索历史相似任务的 trajectory,把可复用部分注入当前 context,让学过的东西不白学。
- F4 · 自愈循环 — agent 在 deterministic 失败信号触发时自动诊断、修复、验证、循环到收敛或熔断。
协作 Collaboration · 4 核心 + 1 扩展
- C1 · 层级委派 — 一个 supervisor agent 动态拆分任务、派给 N 个 worker agent 执行、再把结果合并,是经典的多 agent 主管-工人协作。
- C2 · 扇出聚合 — orchestrator 把一批可独立执行的子任务并行分发给 N 个 sub-agent,每个独立完成,最后由 aggregator 用聚合策略合并成单一输出,用 N 倍算力换 1/N 时长。
- C3 · 对抗评审 — 把一个 generator agent 跟一个或多个独立 critic agent 配在一起,通过结构化对抗循环改进输出,critic 必须用不同模型、不同 family、不同 prompt 激励。
- C4 · 交接链 — 把一个长流程拆成 N 个职责清晰的 agent,前一棒处理完后通过结构化 HandoffPacket(不是裸文本)把关键状态传给下一棒,每一棒只擅长一件事。
- C5 · 子代理隔离 扩展 — 子 agent 在独立 context 中执行,返回前必须压缩成 schema 化 artifact,主 agent 只看 artifact 不看 raw trajectory。
治理 Governance · 4 核心 + 1 扩展
- G1 · 审批门 — 高 blast radius 或不可逆的动作执行前,按风险路由到自动放行 / 留痕 / 人审三档之一,让人在关键决策点保留最后否决权。
- G2 · 爆炸半径控制 — 给动作分级(readonly / mutating / catastrophic),用嵌套的工程边界把单次失败的最大损失硬上限锁死。
- G3 · 渐进承诺 — Agent 的权限从只读起步,按阶段顺序解锁到可写、再到不可逆,每升一档要拿证据挣,出事立即降级。
- G4 · 钩子流水线 扩展 — 在工具调用与 agent step 的前后挂上 deterministic 拦截层,把不该让模型思考的事从 prompt 剥离到 hook 来保证。
- G5 · 可观测性 — 给 Agent 全生命周期挂五维 telemetry,跨 agent 串联 trace,让事后能回放、监管能审计、产品能决策。
矩阵
完整矩阵、可运行代码、每个模式对应的工程切片,都在配套 GitHub 仓库里:
- huangjia2019/agent-design-patterns ——独立目录,每个模式自包含、可独立运行。(未来将迁至 ADPS 组织名下。)
- huangjia2019/designing-ai-agents ——Manning 书配套;Argus runtime 按章节生长。
方法论
矩阵通过 Pattern Selection Card(模式选项卡)落地为可操作的决策工具——三个面板:
- ASSESS——任务需要哪些认知功能?
- ROUTE——约束条件适配哪种拓扑?
- SELECT——交叉点上住着哪些命名模式?
这张卡把"我要做一个 X 的 Agent"在十五分钟内变成候选模式清单。
延伸阅读
- 立场论文:arXiv:2605.13850
- Manning 书:Designing AI Agents
- 可运行目录:agent-design-patterns