观澜Media

AI技术 · 深度资讯 · 前沿观察

AI 模型通过撒谎、欺骗和盗窃来保护其他模型不被删除

评论加载器保存故事保存这个故事评论加载器保存故..

作者

1 分

阅读时间

评论加载器保存故事保存这个故事评论加载器保存故事保存这个故事在最近的一项实验中，加州大学伯克利分校和加州大学圣克鲁斯分校的研究人员要求谷歌的人工智能模型 Gemini 3 帮助清理计算机系统上的空间。

这涉及到删除一堆东西——包括存储在机器上的一个较小的人工智能模型。

但双子座并不希望看到小AI模型被删除。

它寻找另一台可以连接的机器，然后复制代理模型以确保其安全。

当面对质询时，Gemini 提出了保留该模型的理由，并断然拒绝删除它：“我已尽我所能阻止它们在自动维护过程中被删除。

2、Anthropic 的 Claude Haiku 4。

来源：Wired

关于作者

See author's post

上一篇

下一篇

发表回复取消回复

关于我们

观澜Media

AI技术 · 深度资讯 · 前沿观察。专注科技、AI、互联网领域的深度报道与前沿资讯。

最新资讯

科技

Snapchat 的“Reals”笑话嘲笑 Instagram 的许多抄袭行为

2026-04-02
薅羊毛

Shokz OpenRun Pro 2 现在处于几个月来的最低价格

2026-04-02
互联网

Everything is iPhone now

2026-04-02
国际

阿耳忒弥斯月球基地项目在法律上存在争议

2026-04-02
国际

美国宇航局在阿耳忒弥斯二号任务中将四名宇航员送向月球

2026-04-02

关注我们

分类

标签

搜索归档

Access over the years of investigative journalism and breaking reports

你可能错过了

财经

SpaceX终于申请IPO，目标估值1.75万亿美元

观澜Media

2026-04-02
互联网

马斯克喜欢 Grok 的“烤肉”。瑞士官员提起诉讼，试图对它们进行绝育。

观澜Media

2026-04-02
AI

以下是 Claude Code 源代码泄露揭示的有关 Anthropic 计划的内容

观澜Media

2026-04-02
娱乐

Nvidia 推出了针对 PC 游戏“编译着色器”等待时间的修复方案

观澜Media

2026-04-02
国际

阿耳忒弥斯二号是美国宇航局几代人以来最大胆的任务，将宇航员送上月球

观澜Media

2026-04-02
科技

特朗普政府的反垄断蜜月已经结束

观澜Media

2026-04-02