人工智能 Bits-over-Random 指标改变了我对 RAG 和 Agent 的看法 为什么在纸面上看起来很出色的检索在真实的 RAG 和 Agent 工作流程中仍然表现得像噪音 Sean Moran 2026 年 3 月 26 日 19 分钟阅读 分享 受 ICLR 2026 博文/文章《99% 成功悖论:当近乎完美的检索等于随机选择》的启发我在 2000 年代末接受过爱丁堡 Victor Lavrenko 多媒体信息检索实验室的信息检索博士学位,长期以来,我一直通过传统 IR 思维的框架来看待检索:我们是否至少检索到了一个相关块。
下游答案质量在基准上看起来是否可以接受。
但在阅读了最近关于 Bits over Random (BoR) 的工作后,我认为它们对于我们许多人现在实际构建的 Agentic 系统来说是不完整的。
ICLR 博文加深了我在生产 LLM 系统中一段时间以来的感受:检索质量应该考虑到我们找到了多少好内容,以及我们带来了多少不相关的材料。
换句话说,当我们加大召回力度时,我们也会增加环境污染的风险。
当 BoR 下降时,这表明检索到的捆绑包相对于机会的歧视性变得越来越小。
来源:Towards Data Science









