AI技术 · 深度资讯 · 前沿观察

使用 Azure AI 评估 SDK 和 Azure AI Foundry 衡量代理质量和安全性

具有质量指标、安全扫描和可观察运行的 GraphR..

具有质量指标、安全扫描和可观察运行的 GraphRAG 代理的实用评估管道。

在第 4 部分中,我们协调了多个代理。

本文(第 5 部分)回答了一个更难的问题:我们能否证明系统对于生产工作负载来说足够可靠。

对于人工智能工程师来说,仅靠答案质量是不够的。

用于安全和合规性审查的安全证据。

质量:任务完成、意图解析、工具调用行为、基于图形的正确性。

来源:Dev.to

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注