演讲嘉宾|李也 博士 编辑|Kitty 策划|QCon 全球软件开发大会 大模型 Agent 在智能运维场景落地时常常遇到“ 做 demo 容易,泛化难 ”的问题。
在 2025 年 QCon 全球软件开发大会(上海站) 上,阿里云云原生可观测算法专家,香港中文大学计算机专业博士李也作了题为 “ 突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践 ”的演讲,他深入介绍了如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性的实践。
预告:将于 4 月 16 – 18 召开的 QCon 北京站设计了「 Agent 可观测性与评估工程 」专题,本专题立足架构与工程实战,系统探讨如何构建面向 Agent 的全链路语义观测体系,实现对意图决策、中间状态与工具调用的可追踪、可回放、可诊断。
同时通过覆盖离线评测与在线实时度量的评估体系,对任务成功率、路径质量、输出稳定性与效果进行持续量化,驱动 Agent 从“基于经验的盲目调优”转向“基于数据驱动的持续演进”。
以下是演讲实录 (经 InfoQ 进行不改变原意的编辑整理)。
就在不久前,一家海外友商就爆发了一次重大故障。
来源:InfoQ中文







