观澜Media

AI技术 · 深度资讯 · 前沿观察

突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践

演讲嘉宾|李也 博士 编辑|Kitty 策划|QC..

演讲嘉宾|李也 博士 编辑|Kitty 策划|QCon 全球软件开发大会 大模型 Agent 在智能运维场景落地时常常遇到“ 做 demo 容易,泛化难 ”的问题。

在 2025 年 QCon 全球软件开发大会(上海站) 上,阿里云云原生可观测算法专家,香港中文大学计算机专业博士李也作了题为 “ 突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践 ”的演讲,他深入介绍了如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性的实践。

预告:将于 4 月 16 – 18 召开的 QCon 北京站设计了「 Agent 可观测性与评估工程 」专题,本专题立足架构与工程实战,系统探讨如何构建面向 Agent 的全链路语义观测体系,实现对意图决策、中间状态与工具调用的可追踪、可回放、可诊断。

同时通过覆盖离线评测与在线实时度量的评估体系,对任务成功率、路径质量、输出稳定性与效果进行持续量化,驱动 Agent 从“基于经验的盲目调优”转向“基于数据驱动的持续演进”。

以下是演讲实录 (经 InfoQ 进行不改变原意的编辑整理)。

就在不久前,一家海外友商就爆发了一次重大故障。

来源:InfoQ中文

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports