模式矩阵 /模式白皮书/A2

A2 · Plan-and-Execute · 规划-执行

字段
双轴坐标 行动 Action × 链式 Chain(传)
成本档 ②(一次规划 + 多次执行,异构模型可显著压成本)
课程对应 05-03
目录归属 全集 33 模式之一 · 行动模块 5 模式之一
一句话 Agent 先生成完整 plan(含依赖结构、资源预估、审批节点),再按 plan 执行,遇到偏离时局部 replan 而非全局重写。

它解决什么问题

长任务里,逐步反应式(ReAct)的 agent 几乎注定翻车。一个 HR 招聘 agent 把 17 个工具全开放给模型自由决定每一步,结果是:把没面试通过的候选人薪酬发给了招聘经理、跳过背景调查直接发 offer、反复查同一份薪酬数据 50 次。根因是 agent 没有完整 plan——context window 装不下 12 步招聘流程的全貌,模型只能基于"上一步刚发生什么"决定下一步,没有全局视图。

Plan-and-Execute 把动作端拆成两个阶段:先 plan,后 execute。规划阶段一次性把任务排成有序的多步,标清依赖、资源、必须人审的节点;执行阶段按 plan 推进。它的价值在于把宏观顺序从模型的临场判断里拿出来,钉死在一份可审计的计划里。

为什么坐标是「行动 × 链式」

核心机制

Plan-and-Execute 的核心不是复杂,而是三件事:分家、审批闸门、context reset。Aider 的 architect mode 核心只有 9 行代码就把这三件事占全了——architect 出 plan,editor 清空上下文后执行 plan,中间默认要用户确认。

落到工程上有几个关键设计:

研究数据印证了这套范式的经济性。ReWOO 把 plan-execute 的 LLM 调用压到 2 次(一次规划加一次综合),中间所有工具调用并行执行不走模型,相比 ReAct 范式 token 效率高 5 倍、准确率还高 4 个点。

适合的生产场景

容易出错的地方

关键指标

最小骨架

plan = planner(goal, context)        # 强模型,一次
若用户不批准 → 返回
while plan 未完成:
    ready = plan 中依赖已满足的步骤   # 拓扑序
    并行执行 ready:
        成功 → 标记 completed,写 checkpoint
        失败 → replan(受限于 MAX_REPLANS)
    每满 N 步 → adaptive replan 检查 plan 是否仍成立
返回 plan + 完整执行 trace

工程落地要点:Planner、Executor、Approval 用依赖注入,由业务决定具体模型和 prompt;destructive 步骤登记 saga inverse;plan 写文件加版本化。

企业落地一例

梁博团队把"战略层计划"与"战术层执行"显式拆开。Plan-Exec 模式下,计划一旦由规划层写入 Workspace 的 DAG,调度器就按依赖关系推进,不再依赖 LLM 逐步重新选择路径。这正面解决了 ReAct 的结构性问题——ReAct 每一步都要再调一次 LLM 来决策,宏观执行顺序无法被工程化地钉死,长任务里随时可能跑偏。把顺序固化进 DAG 之后,模型只在单步内填参数和解读结果,宏观流程交给确定性的调度器,长任务的可靠性和成本才同时可控。落到 HR 招聘案例:重写成 Planner 加 Executor 加 Approval Gate 三段后,月度账单从 18 万降到 6 万,招聘周期从 23 天压到 16 天。

与其他模式的关系

一句话记住它

Plan-and-Execute 不是"列 todo",而是把人类几十年的项目管理工程沉淀(WBS、PERT、Saga、DAG 调度)原样复刻到 LLM 上——它之所以比单 agent ReAct 更耐用,是因为它站在成熟工程的肩膀上,而且把控制权交还给了用户。


本页属于 ADPS 33 模式白皮书。返回 模式矩阵与白皮书目录, 或查看配套 可运行代码目录