突破泛化瓶颈：阿里云智能运维 Agent 评测体系实践

演讲嘉宾｜李也博士编辑｜Kitty 策划｜QC..

作者

观澜Media

2026-04-02

无评论

2 分

阅读时间

演讲嘉宾｜李也博士编辑｜Kitty 策划｜QCon 全球软件开发大会大模型 Agent 在智能运维场景落地时常常遇到“ 做 demo 容易，泛化难 ”的问题。

在 2025 年 QCon 全球软件开发大会（上海站）上，阿里云云原生可观测算法专家，香港中文大学计算机专业博士李也作了题为 “ 突破泛化瓶颈：阿里云智能运维 Agent 评测体系实践 ”的演讲，他深入介绍了如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性的实践。

预告：将于 4 月 16 – 18 召开的 QCon 北京站设计了「 Agent 可观测性与评估工程」专题，本专题立足架构与工程实战，系统探讨如何构建面向 Agent 的全链路语义观测体系，实现对意图决策、中间状态与工具调用的可追踪、可回放、可诊断。

同时通过覆盖离线评测与在线实时度量的评估体系，对任务成功率、路径质量、输出稳定性与效果进行持续量化，驱动 Agent 从“基于经验的盲目调优”转向“基于数据驱动的持续演进”。

以下是演讲实录（经 InfoQ 进行不改变原意的编辑整理）。

就在不久前，一家海外友商就爆发了一次重大故障。

来源：InfoQ中文

关于作者

观澜Media

See author's post

2026-04-02

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

关注我们

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

查看全部

科技

登月後再登火星？NASA 任務為何至關重要？

观澜Media

2026-04-02
社会

1970年代的石油危機是什麼樣子？我們會否面臨更糟糕的局面？

观澜Media

2026-04-02
社会

報告和目擊者指伊朗安全部隊在戰爭期間使用兒童

观澜Media

2026-04-02
科技

雄安新區十年：領導人「個人設想」、洪水爭議與「疏解」暗戰

观澜Media

2026-04-02
科技

伊朗戰爭添風險　亞洲外勞糾結應否繼續在波斯灣「拼命」

观澜Media

2026-04-02
国内

不想買還是買不起？——香港青年置業率持續下降

观澜Media

2026-04-02

观澜Media