概念/概念定义

草稿纸看板:ReAct 的工作记忆

出自东方屹腾执行型 Agent 落地(案例提供 梁博)

草稿纸看板:ReAct 的工作记忆

概念定义

推理给出了下一步,行动要把这一步真正执行完成。执行型 Agent 的推理每次只推进一步,执行后要根据结果再决定接下来怎么做,因此行动能力本身需要同时承载推理与执行:执行一步,观察结果,距目标还有差距就继续执行,逐步逼近目标。这要求工具调用被封装进行动能力,由行动能力统一调度,而非由模型裸调工具。这正是 ReAct 行动模式,它需要一块工作记忆来保存前面各步的执行情况,这块工作记忆就是草稿纸看板。

使用说明

ReAct 的每一轮都包含明确的 Thought、Action、Observation 三件套:先判断这一步要做什么,再执行一个实际动作,再观察动作返回的结果。这三件套作为一个 block 追加到草稿纸看板(scratchpad)这个结构上。一轮接一轮,看板上就形成了一条 block 链。后面的步骤不是从零开始,而是先读取看板,在已完成步骤的基础上继续推理:上一步查到了什么、上一步调工具拿回了什么,都记录在看板上供这一步参考。它的命名来自这块结构的形态——像一张草稿纸,把演算过程逐行往下记录,需要时回看进展到了哪一步。

草稿纸看板解决的是模型的失忆问题。LLM 每次调用都是无状态的,模型本身不会记得上一轮发生过什么。如果不把每一轮的思考、动作、结果显式记录下来再回传给模型,Agent 到第三步就可能丢失第一步查到的关键信息,从而重复执行已完成的工作,或在残缺认知的基础上做出错误判断。草稿纸看板把这条执行轨迹外置成一个可读、可追加的数据结构,让原本无记忆的循环获得连续的工作记忆,每一步都能在前几步的成果之上继续。

东方屹腾验证薪资组快速搭建场景时,ReAct 的这块看板是行动循环运转的基础。用户提出搭建薪资组的诉求后,Agent 逐步推进而不预先规划完所有步骤:先判断需要匹配薪资组模板,执行匹配动作,观察匹配返回的结果,把这一轮的三件套追加进看板;下一步读取看板,得知模板已匹配完成,再判断需要建快照、随后导入。每一步的实际操作都在 Orchestrator 里完成,完成后对照用户目标核对进展,再决定下一轮。控制信号驱动每一步走哪个具体动作,看板则保证这一连串动作之间的状态连续传递。

何时需要

当 Agent 要在一个目标下连续执行多步,且每一步是否继续、下一步做什么都依赖前几步的真实结果时,就需要一块草稿纸看板把执行轨迹记录下来。如果各步之间存在清晰的依赖关系、宏观顺序可以提前确定,ReAct 就会把控制权交还给任务 DAG 与状态机,从走一步看一步切换到规划执行。草稿纸看板记录的执行进展,与最终汇集"用户要什么、做到哪了"的叙事记忆是两类不同的状态,后者由记忆信封承载。


这是 ADPS 蓝皮书(企业落地实践)。返回 案例库模式矩阵