使用 Azure AI 评估 SDK 和 Azure AI Foundry 衡量代理质量和安全性

具有质量指标、安全扫描和可观察运行的 GraphRAG 代理的实用评估管道。

在第 4 部分中,我们协调了多个代理。

本文(第 5 部分)回答了一个更难的问题:我们能否证明系统对于生产工作负载来说足够可靠。

对于人工智能工程师来说,仅靠答案质量是不够的。

用于安全和合规性审查的安全证据。

质量:任务完成、意图解析、工具调用行为、基于图形的正确性。

来源:Dev.to