概念/概念定义

可观测性：玻璃罩里的瑞士机械表

出自东方屹腾执行型 Agent 落地（案例提供梁博）

可观测性：玻璃罩里的瑞士机械表

概念定义

执行型 Agent 的一次对话，背后是一长串看不见的动作：识别意图、路由分支、链式推理、调用工具、读写状态、合成回复。如果开发者只能看到两层——用户输入和最终回复——中间全是黑盒，那么这台系统每出一次问题，定位都要靠猜。可观测性要解决的就是这件事：把 Agent 的每一步动作和驱动这步动作的思考，按时间轴完整地暴露给开发者自己。

这里的"可观测"有一层需要先说清的语义。它指的不是 Agent 对它所处世界的感知，而是反过来——让 Agent 的意识和行为对开发者可见。Agent 在一次对话里产生的一系列行动是它的躯体活动，驱动这些行动的推理和判断是它的精神活动，可观测性要把这两者都摊开来看。

使用说明

玻璃罩这个比喻就出在这里。开发态把全部可观测事件打开之后，组装这台复杂精密的 Agent，体验接近在一个透明玻璃罩里修一块瑞士机械表。机械表零件多、咬合精密，但只要罩子是透明的，每个齿轮在哪里转、哪根游丝在动，都看得见。Agent 同理：意图识别这一环识别出了什么、意图网关把它路由到了哪条下游链、ReAct 跑到第几步、这一步的 LLM 调用用的是什么提示词、模型返回了什么、花了多少成本，都在时间轴上按顺序排开。系统越复杂，这层透明罩越能减轻开发者的心智负担——它没有降低系统本身的复杂度，但让复杂度变得可见、可查。

它防住的失败很具体。执行型 Agent 链路长、环节多，一旦某次交付不符合预期，问题可能出在意图识别误判、可能出在某步推理跑偏、也可能出在一次工具调用的参数绑定。没有时间轴，开发者只能反复重放整个对话去推测哪一环出了岔，调试周期被拉得很长。把每一步的动作和 LLM 调用细节都摊在时间轴上，定位就从猜测变成查看——哪一步的输出和预期不符，一眼就能落到那一格。

东方屹腾把这条经验放在了起步阶段，而不是等系统复杂了再补。项目从最朴素的对话管道接通起步，第一件认真做足的基础设施就是可观测性。做法是把 Agent 的活动和程序逻辑统一封装抽象成带语义的事件——用户意图识别、意图网关路由判定、ReAct 执行都是这样的事件——再把一次对话的整个执行过程按时间轴清晰展示出来。每一步既能看到 Agent 产生了什么动作，也能按时间顺序看到这一步的 LLM 调用细节：运行态实际用的提示词、模型的输出、这一步相关的各种成本。这些调试详情在生产投放时可以关掉，开发态时在前端打开。地基铺好之后，后面往上逐步堆意图识别、推理、行动这些能力，每堆一层都能直接看见它在罩子里怎么工作。

何时需要

当你的 Agent 一次对话要走多步、跨多个能力环节，且每一步都可能出错。环节越多、链路越长，把执行过程在开发态摊成一条透明的时间轴，回报就越大。这层时间轴展示的对象，是 Orchestrator 在运行态编排出的那一串活动事件。

这是 ADPS 蓝皮书（企业落地实践）。返回案例库或模式矩阵。