概念/概念定义

意图即编译:把活的编译成死的

出自东方屹腾执行型 Agent 落地(案例提供 梁博)

意图即编译:把活的编译成死的

概念定义

意图识别是把用户的自然语言,编译成编排器能执行的、明确可识别的控制信号。它本质上也是一次推理,只是这次推理的产物不是一段回复,而是一个能被程序读取、用来选择下游分支的离散信号。

使用说明

把它叫"编译",是因为这一步做的事跟编译器做的事是一回事:源头是活的、不确定的、形态自由的输入,目标是死的、可控的、能被机器直接执行的指令。用户口语里那句"帮我搭个薪资组",模型读得懂,但程序读不懂;程序只读得懂"这是一个 resolve 信号"。意图识别站在两者中间,用提示词引导 LLM 返回结构化输出,把用户意图收敛抽象到系统内可接纳的几个下游控制信号上。从这一步往后,程序面对的是一个枚举里的确定值,而非一段可能跑偏的语义。

这一步防住的,是把自然语言直接喂进控制流。如果不先编译,程序就得在每个分支点临场去问模型"用户现在到底想干嘛",让概率模型来决定下一步走哪条路。LLM 是概率模型,把确定性的分支判断交给它临场决定,结果就是有时走对、有时明显走错,而且什么时候出错既不可控也无法预料。编译这一步把不确定性集中处理掉:发散的语义在入口处一次性收敛成确定的信号,之后的控制流就是一台干净的状态机,可以单测、可以回放。

东方屹腾最早落地意图识别时,识别出三种基本意图。第一种是闲聊,尽快拦截结束,不发起后面高成本的推理和行动。第二种是分析,比如用户上传一张薪资表想让 Agent 分析,这类检索一下领域知识再调一次 LLM 即可。第三种是理解意图并准确编排一系列工具完成任务,这才是核心场景。这三种早期定为 chat、analyze、resolve,后来按下游业务演化成 task、information、produce、chat 等更丰富的信号。因为 LLM 不可靠,这里设了兜底:意图没解析到就统一打成 unknown,下游配套 unknown 的兜底逻辑。也正是在这第一个意图识别环节,团队第一次看到了控制平面与叙事平面的分离——一个能力环节的输出里,既有驱动程序走向的控制信号,也有供下游推理消费的叙事内容。

何时需要

当你的 Agent 要把用户口语化的请求接进一条确定的执行流,而不是直接生成一段内容回去。编译出来的控制信号交给谁消费、怎么按信号路由到不同下游执行链,就是 Orchestrator 与意图网关;为什么入口处必须先把语义收敛成信号,根子在 控制叙事二元论


这是 ADPS 蓝皮书(企业落地实践)。返回 案例库模式矩阵