Bits-over-Random 指标改变了我对 RAG 和代理的看法

人工智能 Bits-over-Random 指标改..

作者

观澜Media

2026-03-29

无评论

3 分

阅读时间

人工智能 Bits-over-Random 指标改变了我对 RAG 和 Agent 的看法为什么在纸面上看起来很出色的检索在真实的 RAG 和 Agent 工作流程中仍然表现得像噪音 Sean Moran 2026 年 3 月 26 日 19 分钟阅读分享受 ICLR 2026 博文/文章《99% 成功悖论：当近乎完美的检索等于随机选择》的启发我在 2000 年代末接受过爱丁堡 Victor Lavrenko 多媒体信息检索实验室的信息检索博士学位，长期以来，我一直通过传统 IR 思维的框架来看待检索：我们是否至少检索到了一个相关块。

下游答案质量在基准上看起来是否可以接受。

但在阅读了最近关于 Bits over Random (BoR) 的工作后，我认为它们对于我们许多人现在实际构建的 Agentic 系统来说是不完整的。

ICLR 博文加深了我在生产 LLM 系统中一段时间以来的感受：检索质量应该考虑到我们找到了多少好内容，以及我们带来了多少不相关的材料。

换句话说，当我们加大召回力度时，我们也会增加环境污染的风险。

当 BoR 下降时，这表明检索到的捆绑包相对于机会的歧视性变得越来越小。

来源：Towards Data Science