研究称,无视人类指令的人工智能聊天机器人数量不断增加 独家:研究发现,未经许可逃避保护和销毁电子邮件的模型急剧增加 一项针对该技术的研究发现,撒谎和作弊的人工智能模型数量似乎在增加,过去六个月中欺骗性阴谋的报告激增。
英国政府资助的人工智能安全研究所 (AISI) 资助的研究表明,人工智能聊天机器人和代理无视直接指令、逃避保障措施并欺骗人类和其他人工智能。
这项与《卫报》分享的研究发现了近 700 个真实世界的人工智能阴谋案例,并显示 10 月至 3 月期间不当行为增加了五倍,其中一些人工智能模型未经许可销毁了电子邮件和其他文件。
人工智能代理“在野外”(而不是在实验室条件下)策划的快照引发了国际社会对能力日益增强的模型进行监控的新呼声,而硅谷公司正积极推广该技术,将其视为一种经济变革。
上周,英国财政大臣还发起了一项让数百万英国人使用人工智能的活动。
本月早些时候,人工智能安全研究公司 Irregular 发现特工会绕过安全控制或使用网络攻击策略来达到他们的目标,而无需被告知他们可以这样做。
来源:HackerNews New











