观澜Media

AI技术 · 深度资讯 · 前沿观察

评估驱动的开发:将 TDD 原则应用于 AI 代理提示

所有帖子 评估驱动开发:在提示之前编写规则 202..

所有帖子 评估驱动开发:在提示之前编写规则 2026 年 3 月 28 日 · Ian Parent edd eval-driven-development agent-eval tdd mcp 词汇 大多数构建 AI 代理的团队都遵循相同的工作流程:编写提示、运行它、查看输出、调整、重复。

“足够好”的定义是最后一位审稿人认为可以接受的任何内容。

它会根据谁在审阅、一天中的什么时间以及截止日期的临近而变化。

三十年前,正是这一学科改变了软件开发,应用于人工智能代理的独特属性。

这称为评估驱动开发 (EDD) — 核心原则很简单:在编写提示之前定义评估规则。

在开始构建之前定义“正确”的样子。

来源:HackerNews New

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports