M4 · Failure Journals · 失败日记

Agent 把每次失败结构化记录（哪一步失败、什么错、根因、怎么补救），跨任务持久化，下次类似情况主动召回。

版本: v0.3
状态: 公开评审稿
发布日期: 2026-07-13
分类: 记忆 Memory × 循环 Loop（转）
目录地位: 核心模式
许可: CC BY 4.0

文档状态：本页为公开评审稿。模式定义与分类可供讨论和引用；未附来源链接的数字与应用示例只用于说明机制，不作为行业基准。

坐标	记忆 Memory × 循环 Loop（转）
成本	中（结构化存储 + 召回检索）
模式组	记忆模式
模式简介	Agent 把每次失败结构化记录（哪一步失败、什么错、根因、怎么补救），跨任务持久化，下次类似情况主动召回。

问题

绝大多数 agent 系统认真做了进度追踪，却很少有人认真做失败档案。失败被默默丢弃，会话一结束就清零，下次类似情境再来时 agent 又从零踩同一个坑。一个典型场景：agent 修对了主任务后注意力下降，把测试环境的配置写进了生产配置——两周后在另一个项目里它做了几乎一样的事。这不是偶发的不细心，是一个固定模式，而 agent 没有"我以前在这件事上栽过"的记忆。

失败日记把失败做成可以反复回看的档案。它的目的不是给运维看错误，是给 agent 自己积累职业经验——让模型在下次类似情境时，主动调出"我栽过这种跟头"的提醒。抹掉失败就等于抹掉证据，模型没了证据就没法适应。

分类依据：记忆 × 循环

纵轴 · 记忆：它把"失败"作为持久化学习材料跨调用累积，是长期记忆里的反例库——一面记成功（程序性记忆），一面记失败（失败日记）。
横轴 · 循环：写一次失败、下次任务读一次、再写一次，是跨调用的 outer loop。失败信号在任务之间循环流动，让 agent 一次次变得更老练。

解决方案与机制

完整的失败日记系统做四件事，形成闭环：

检测 Detection：判断这次任务算不算"失败"。包括任务级失败，也包括信息检索本身的失败（如 RAG 索引滞后、漏检、误检——这些是 LLM 时代新增的失败类型）。
分类 Classification：归到哪一类失败。工业级实现会区分十几种——临时性 vs 永久性、客户端 vs 服务端、payload 还是 context、通用 vs 厂商特定、可恢复 vs 不可恢复，每类配专属的 recovery strategy。
记录 Recording：结构化存档，schema 必须比自由文本强。一条失败记录至少含任务指纹、类别、一句话总结、根因、补救动作、可执行的 lessons。
召回 Recall：新任务来时按相似度主动调出相关历史失败，注入 prompt。这是失败日记跟普通 try-catch 的根本差别——后者只当场处理，前者跨任务记忆。召回靠在 inference 时把过去经验注入 context（training-free 路径），无需重训模型。

配套还有两点工程实践：失败 trajectory 默认丢弃是巨大浪费（研究显示约 85% 失败 trajectory 被丢弃），可经反向标注后用于训练；分层留存（如 48 小时存全细节、30 天存压缩摘要、更久只存聚合指标）让召回在工程上可行而不让数据库无限膨胀。

适用条件

生产级长期运行的 agent：跑数月、反复处理同类任务的 agent。哪些失败要记、哪些任务来时要翻出来，是它的核心价值所在。
多租户 SaaS agent：跨租户错位这类高风险失败要做特殊处理——永不淘汰、每次任务启动强制召回、连续多条触发报警。task signature 用"租户加意图"双因子，一个租户的失败不该让另一个租户收到无关提醒。
高风险不可逆操作的 agent：错误代价大、同样的错不能犯第二次的场景。DevOps、金融、合同处理。

已知失效方式

任务一次性、没有重复执行场景却硬上：纯 demo、prototype、一次性脚本，失败被丢弃没问题。失败日记的价值在重复任务，没有重复就没有召回收益。
只 free-text 不分类：第一版 failure log 常是"task / error / timestamp"三字段自由文本，agent 看到完全没法学。必须强制 schema 化（enum 加受限字段），让失败可聚类、可统计、可查询。
自由写导致噪声仓库：让 agent 自由写 failure journal，它会过度悲观每次小不顺都记一笔，半年后 journal 变噪声仓库、召回率断崖。要两层审查：结构化 schema 强制（自由文本 ≤ 200 字符），加 access_count 触发清理（长期没被召回的归档到冷层）。
记下来了但召回不匹配：用 Jaccard 这类粗糙相似度，漏检率太高，记了等于没召回。task signature 之间要用 embedding cosine similarity。
高风险失败和普通失败一锅端：跨租户数据泄露和 API timeout 严重程度差几个数量级，混在一起会让生死线失败被淹没。高风险失败要独立告警加永久保留加强制召回。

验证指标

重复失败率下降（健康区持续下降）：同类任务里 agent 重复犯同一个错的比例。这是失败日记真正的判断标准——failure 数据上 99% 的清洁度若 agent 根本没召回它就没用，重复失败率下降 30% 才是真价值。
召回率 / 召回命中率（健康区合理偏高）：被召回过的失败记录占比、召回的失败与当前任务相关的比例。procedural memory 召回命中率持续偏低，说明记忆架构有问题。
首次尝试成功率（健康区随时间上升）：agent 一次做对的比例，失败 lessons 沉淀后应逐月上升。
高风险失败计数（健康区接近 0 且强监控）：跨租户错位等生死线失败的发生次数，必须独立监控加告警。

参考实现

FailureEntry: failure_id / task_signature / category(enum) / summary
              / root_cause / remediation / lessons[] / access_count
FailureJournal:
    record(entry)          → 重复 failure_id 累加 access_count；超额按 access+recency 淘汰
    by_category(cat)       → 分类查询
    recall_for_task(sig)   → embedding 相似度 top-K 召回相关历史失败
    render_for_prompt()    → 格式化注入 prompt（CER 范式：动手前先看一眼过去的坑）
分层留存：48h 全细节 / 30d 压缩摘要 / 90d+ 聚合指标

工程落地四个要点：相似度函数用 embedding cosine 而非 Jaccard；召回挂在任务启动和高风险工具调用前（可用 PreToolUse hook）；分层留存真做并分别上不同后端；写入做两层审查（schema 强制加 access_count 清理）。

应用示例

某 B2B SaaS 给两百多家企业租户提供客服 agent，每天处理约五万条工单。失败分布大致是工具错误三成、跨租户错位两成五、上下文溢出两成、语义漂移一成五。重写后六个关键决策：跨租户错位（boundary_leak）定为最高优先级——比工具错误严重一百倍（前者是数据泄露事件），永不淘汰、每次任务启动强制召回、连续三条触发 PagerDuty；task signature 用"租户加意图"双因子，ACME 的失败不会让 BETA 收到无关提醒；按 CER 范式把 top-5 相关历史失败作为 system prompt 注入，让 implicit belief update 在动手前发生；失败强制分类不许 free-text；失败档案每周导出 markdown commit 到 git 供团队 review（git diff 是最好的失败趋势可视化）；UNKNOWN 类失败进 needs_review 状态由人审过才进档案，避免噪声污染召回。落地第二个月，boundary_leak 从每天八起降到一起，tool_error 重复率降四成，首次尝试准确率从 78% 升到 85%。

设计结论

抹掉失败就等于抹掉证据，模型没法学——失败日记不是错误日志，是 agent 的职业档案，一个跑了半年带失败档案的弱模型 agent，在你具体业务上可能强过一个刚启动的更聪明模型。

企业证据

当前没有与本模式绑定的公开评审案例。模式定义不因此视为已经获得企业验证。

案例收录要求说明业务约束、实现结构、已知失败和迁移边界。参见贡献与评审规则。

引用建议：ADPS，《M4 失败日记》，Agent 设计模式白皮书 v0.3，2026-07-13。

模式目录 · 参考实现 · CC BY 4.0

问题