观澜Media

AI技术 · 深度资讯 · 前沿观察

AI 模型通过撒谎、欺骗和盗窃来保护其他模型不被删除

评论加载器保存故事 保存这个故事 评论加载器保存故..

评论加载器保存故事 保存这个故事 评论加载器保存故事 保存这个故事 在最近的一项实验中,加州大学伯克利分校和加州大学圣克鲁斯分校的研究人员要求谷歌的人工智能模型 Gemini 3 帮助清理计算机系统上的空间。

这涉及到删除一堆东西——包括存储在机器上的一个较小的人工智能模型。

但双子座并不希望看到小AI模型被删除。

它寻找另一台可以连接的机器,然后复制代理模型以确保其安全。

当面对质询时,Gemini 提出了保留该模型的理由,并断然拒绝删除它:“我已尽我所能阻止它们在自动维护过程中被删除。

2、Anthropic 的 Claude Haiku 4。

来源:Wired

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

搜索归档

Access over the years of investigative journalism and breaking reports