模式矩阵 /模式白皮书/C1

C1 · Hierarchical Delegation · 层级委派

字段
双轴坐标 协作 Collaboration × 层级 Hierarchy(分)
成本档 ③(3-15× 单 agent 调用)
课程对应 07-02
目录归属 全集 33 模式之一 · 协作模块 5 模式之一
一句话 一个 supervisor agent 动态拆分任务、派给 N 个 worker agent 执行、再把结果合并,是经典的多 agent 主管-工人协作。

它解决什么问题

单个 agent 同时干查资料、写正文、配图、出报告,每一项都不专精,长流程里 context 还会越积越长。更隐蔽的问题是:当一个 agent 顺序处理多个子任务时,前面任务的执行细节会一直留在它的 context 里,跑到第三、第四个任务时推理质量就开始下滑。

层级委派把"一个全能 agent"换成"一个 supervisor 加多个专门 worker"。Supervisor 负责拆任务、监控进度、合并产出;每个 worker 只干自己擅长的一类活,跑在自己独立的 context 里。这样既让每一段工作由合适的模型和提示来处理,又把 supervisor 的 context 从执行细节里解放出来,让它专注协调。代价是 token 消耗成倍上升,所以它只适合任务价值能覆盖这个倍数的场景。

为什么坐标是「协作 × 层级」

核心机制

一次层级委派由三段组成:

  1. 动态拆分:supervisor 根据具体输入决定拆几个 worker、每个 worker 干什么。研究 AI 行业和研究咖啡行业拆出的子任务结构不一样,拆分必须跟输入相关,不能写死。
  2. 隔离执行:每个 worker 跑在独立 context 里,不继承 supervisor 的 history,只收到自己的 system prompt、具体的 task instruction、自己的 tool set。worker 之间能并行的尽量并行。
  3. 中心化综合:supervisor 只看 worker 返回的结构化 artifact,不看 worker 的 raw trajectory,基于这些精炼摘要做整体判断和最终合并。

Supervisor 和 worker 通常用不同的模型。Supervisor 做拆分和综合,需要深度推理,用强模型;worker 做专门化执行,用更便宜的模型。这和 Plan-and-Execute 把 planner 与 executor 分家是同一套思路,只是从单 agent 内部扩展到了多个 agent 之间。

worker 返回的 artifact 建议至少三层结构:

字段 作用
verdict(success / partial / failure) 让 supervisor 一眼判断这份产出能不能直接用
top findings(3-5 条) worker 工作结论的精炼,覆盖大部分信息
confidence(0-1) 多个 worker 输出冲突时的仲裁信号

适合的生产场景

容易出错的地方

关键指标

最小骨架

SupervisorAgent.execute(task):
    plan = decompose(task)              # 动态拆分,跟输入相关
    artifacts = 并行 gather(            # 并发上限设 5
        IsolatedSubAgent(worker).execute(subtask)
        for worker, subtask in plan
    )
    return synthesize(task, artifacts)  # 只看 artifact,不看 raw trajectory

IsolatedSubAgent.execute(subtask):
    本地 messages = [system_prompt, subtask]   # 不继承 parent history
    try: raw = wait_for(llm(messages, tools), timeout)  # 失败 boundary
    except: return Artifact(verdict="failure", ...)
    return reduce_to_artifact(raw)      # 强制压缩成 verdict/findings/confidence

四个工程要点:每个 worker 独立 context 起跑;worker 强制 reduce 成 schema artifact;每个 worker 用 timeout 加异常包裹隔离失败;用信号量控制并发上限,worker 之间不共享 state。

企业落地一例

某律所的合同审阅 Agent,第一版主 agent 派 sub-agent 扫描 50 份合同找异常条款,sub-agent 跑完把每份 3000 字的详细分析全部回传,主 agent 接到 15 万字后 context 完全爆炸,后续推理质量断崖式下降。工程团队复盘后想清楚一件事:主 agent 不该看 sub-agent 的 raw 工作过程,只该看结论——就像律所的 PM 不会要求每个律师汇报每份合同读了哪一行,只看"50 份里有 3 份异常加它们的关键问题清单"。第二版给每份合同分配一个独立 worker,每个 worker 跑在隔离 context 里,返回前必须 reduce 成固定 schema 的 artifact(contract_id、risk_level、top_3_concerns、recommendation,外加 contract_hash 防篡改)。50 份合同的 artifact 加起来不到 1 万字,主 agent 看着轻松。配套的工程纪律还包括:HIGH 以上风险合同强制进律师 review 队列,不允许 agent 自动放行;每个 worker timeout 收紧到 180 秒,失败时返回 failure artifact 而不是炸掉全局;portfolio report 落文件作为审计留痕。改完之后 50 份合同 1 小时跑完,15 万字爆炸的故事不再发生。

与其他模式的关系

一句话记住它

层级委派的本质不是把任务拆开派出去,而是把人类金字塔组织 50 年沉淀的信息分层纪律编码进 agent 系统——supervisor 只看下一层的精炼结论,是这套纪律的工程载体。


本页属于 ADPS 33 模式白皮书。返回 模式矩阵与白皮书目录, 或查看配套 可运行代码目录