概念/概念定义

草稿纸看板：ReAct 的工作记忆

出自东方屹腾执行型 Agent 落地（案例提供梁博）

草稿纸看板：ReAct 的工作记忆

概念定义

推理给出了下一步，行动要把这一步真正执行完成。执行型 Agent 的推理每次只推进一步，执行后要根据结果再决定接下来怎么做，因此行动能力本身需要同时承载推理与执行：执行一步，观察结果，距目标还有差距就继续执行，逐步逼近目标。这要求工具调用被封装进行动能力，由行动能力统一调度，而非由模型裸调工具。这正是 ReAct 行动模式，它需要一块工作记忆来保存前面各步的执行情况，这块工作记忆就是草稿纸看板。

使用说明

ReAct 的每一轮都包含明确的 Thought、Action、Observation 三件套：先判断这一步要做什么，再执行一个实际动作，再观察动作返回的结果。这三件套作为一个 block 追加到草稿纸看板（scratchpad）这个结构上。一轮接一轮，看板上就形成了一条 block 链。后面的步骤不是从零开始，而是先读取看板，在已完成步骤的基础上继续推理：上一步查到了什么、上一步调工具拿回了什么，都记录在看板上供这一步参考。它的命名来自这块结构的形态——像一张草稿纸，把演算过程逐行往下记录，需要时回看进展到了哪一步。

草稿纸看板解决的是模型的失忆问题。LLM 每次调用都是无状态的，模型本身不会记得上一轮发生过什么。如果不把每一轮的思考、动作、结果显式记录下来再回传给模型，Agent 到第三步就可能丢失第一步查到的关键信息，从而重复执行已完成的工作，或在残缺认知的基础上做出错误判断。草稿纸看板把这条执行轨迹外置成一个可读、可追加的数据结构，让原本无记忆的循环获得连续的工作记忆，每一步都能在前几步的成果之上继续。

东方屹腾验证薪资组快速搭建场景时，ReAct 的这块看板是行动循环运转的基础。用户提出搭建薪资组的诉求后，Agent 逐步推进而不预先规划完所有步骤：先判断需要匹配薪资组模板，执行匹配动作，观察匹配返回的结果，把这一轮的三件套追加进看板；下一步读取看板，得知模板已匹配完成，再判断需要建快照、随后导入。每一步的实际操作都在 Orchestrator 里完成，完成后对照用户目标核对进展，再决定下一轮。控制信号驱动每一步走哪个具体动作，看板则保证这一连串动作之间的状态连续传递。

何时需要

当 Agent 要在一个目标下连续执行多步，且每一步是否继续、下一步做什么都依赖前几步的真实结果时，就需要一块草稿纸看板把执行轨迹记录下来。如果各步之间存在清晰的依赖关系、宏观顺序可以提前确定，ReAct 就会把控制权交还给任务 DAG 与状态机，从走一步看一步切换到规划执行。草稿纸看板记录的执行进展，与最终汇集"用户要什么、做到哪了"的叙事记忆是两类不同的状态，后者由记忆信封承载。

这是 ADPS 蓝皮书（企业落地实践）。返回案例库或模式矩阵。