所有帖子 评估驱动开发:在提示之前编写规则 2026 年 3 月 28 日 · Ian Parent edd eval-driven-development agent-eval tdd mcp 词汇 大多数构建 AI 代理的团队都遵循相同的工作流程:编写提示、运行它、查看输出、调整、重复。
“足够好”的定义是最后一位审稿人认为可以接受的任何内容。
它会根据谁在审阅、一天中的什么时间以及截止日期的临近而变化。
三十年前,正是这一学科改变了软件开发,应用于人工智能代理的独特属性。
这称为评估驱动开发 (EDD) — 核心原则很简单:在编写提示之前定义评估规则。
在开始构建之前定义“正确”的样子。
来源:HackerNews New




