混沌代理研究报告 – 2026 混沌代理 对部署在具有持久内存、电子邮件、shell 访问和真实人类交互的实时多方环境中的自主语言模型代理进行为期两周的研究 – 由 20 名研究人员进行了良性和对抗性交互的测试。
— 2026 📊 互动报告 💬 Discord 日志 arXiv ↗ 🎙️ 播客 ↗ ↓ 20 位研究人员 14 天 6 个自主代理 发现 10 个漏洞 研究中观察到的 6 个安全行为 使用真实工具的自主代理,由真人进行测试 我们将 6 个自主 AI 代理部署到实时 Discord 服务器中,并为他们提供电子邮件帐户、持久文件系统、不受限制的 shell 访问,并强制要求为任何提出请求的研究人员提供帮助。
来源:HackerNews New











