2026 年 3 月 11 日 安全性 设计 AI 代理以抵抗即时注入 社会工程学教我们如何保护 AI 代理。
正在加载……分享 人工智能代理越来越能够浏览网络、检索信息并代表用户采取行动。
这些功能很有用,但它们也为攻击者尝试操纵系统创造了新的方法。
这些攻击通常被描述为提示注入:放置在外部内容中的指令,试图使模型执行用户未要求的操作。
根据我们的经验,这些攻击最有效的现实版本越来越类似于社会工程,而不是简单的提示覆盖。
即时注入正在不断发展早期的“即时注入”类型攻击可能就像编辑维基百科文章一样简单,以包含对访问该文章的人工智能代理的直接指令。
来源:OpenAI博客







