概念/概念定义
可观测性:玻璃罩里的瑞士机械表
出自东方屹腾执行型 Agent 落地(案例提供 梁博)

概念定义
执行型 Agent 的一次对话,背后是一长串看不见的动作:识别意图、路由分支、链式推理、调用工具、读写状态、合成回复。如果开发者只能看到两层——用户输入和最终回复——中间全是黑盒,那么这台系统每出一次问题,定位都要靠猜。可观测性要解决的就是这件事:把 Agent 的每一步动作和驱动这步动作的思考,按时间轴完整地暴露给开发者自己。
这里的"可观测"有一层需要先说清的语义。它指的不是 Agent 对它所处世界的感知,而是反过来——让 Agent 的意识和行为对开发者可见。Agent 在一次对话里产生的一系列行动是它的躯体活动,驱动这些行动的推理和判断是它的精神活动,可观测性要把这两者都摊开来看。
使用说明
玻璃罩这个比喻就出在这里。开发态把全部可观测事件打开之后,组装这台复杂精密的 Agent,体验接近在一个透明玻璃罩里修一块瑞士机械表。机械表零件多、咬合精密,但只要罩子是透明的,每个齿轮在哪里转、哪根游丝在动,都看得见。Agent 同理:意图识别这一环识别出了什么、意图网关把它路由到了哪条下游链、ReAct 跑到第几步、这一步的 LLM 调用用的是什么提示词、模型返回了什么、花了多少成本,都在时间轴上按顺序排开。系统越复杂,这层透明罩越能减轻开发者的心智负担——它没有降低系统本身的复杂度,但让复杂度变得可见、可查。
它防住的失败很具体。执行型 Agent 链路长、环节多,一旦某次交付不符合预期,问题可能出在意图识别误判、可能出在某步推理跑偏、也可能出在一次工具调用的参数绑定。没有时间轴,开发者只能反复重放整个对话去推测哪一环出了岔,调试周期被拉得很长。把每一步的动作和 LLM 调用细节都摊在时间轴上,定位就从猜测变成查看——哪一步的输出和预期不符,一眼就能落到那一格。
东方屹腾把这条经验放在了起步阶段,而不是等系统复杂了再补。项目从最朴素的对话管道接通起步,第一件认真做足的基础设施就是可观测性。做法是把 Agent 的活动和程序逻辑统一封装抽象成带语义的事件——用户意图识别、意图网关路由判定、ReAct 执行都是这样的事件——再把一次对话的整个执行过程按时间轴清晰展示出来。每一步既能看到 Agent 产生了什么动作,也能按时间顺序看到这一步的 LLM 调用细节:运行态实际用的提示词、模型的输出、这一步相关的各种成本。这些调试详情在生产投放时可以关掉,开发态时在前端打开。地基铺好之后,后面往上逐步堆意图识别、推理、行动这些能力,每堆一层都能直接看见它在罩子里怎么工作。
何时需要
当你的 Agent 一次对话要走多步、跨多个能力环节,且每一步都可能出错。环节越多、链路越长,把执行过程在开发态摊成一条透明的时间轴,回报就越大。这层时间轴展示的对象,是 Orchestrator 在运行态编排出的那一串活动事件。