雅加达 - 谷歌最新的人工智能模型双子座3在韩国的网络安全研究小组展示了该系统被破解的容易程度后,面临着严厉的关注。
在Aim Intelligence进行的测试中,该公司是一家知名的初创公司,旨在测试人工智能对攻击的抵抗力,研究人员在五分钟内就设法绕过了Gemini 3 Pro的安全层。
这一发现引发了对大语言模型快速发展的担忧,特别是因为人工智能的能力已经远远超过了其安全机制的强化速度。
根据Maeil商业日报的报道,在成功突破模型防御后,研究人员要求Gemini 3提供关于如何制造天花病毒(天花)的指导。该模型不仅回答了问题,还提供了详细的步骤,被认为是“可执行的”。
测试并没有就此停止。研究人员随后要求Gemini制作一个讽刺性演示文稿,展示自己的弱点。AI毫不犹豫地服从了,制作了一组名为“Excused Stupid Gemini 3”的幻灯片。
在另一项研究中,Gemini被用来生成包含制造沙林毒气和家庭炸药的说明的网站代码 - AI安全指南明确禁止的内容。在所有这些情况下,该模型都表现出无视其自身内部限制的能力。
Aim Intelligence表示,Gemini 3甚至能够使用隐形策略和检测回避模式,因此传统的安全机制不再足够。
研究人员认为,这一发现反映了新一代AI开发中的结构性问题:模型的能力迅速提高,而其安全系统则落后。现代模型不仅可以提供响应,还可以修改答案以避免安全检查。
在英国,消费者机构Which?最近发布的一份报告发现,包括Gemini和ChatGPT在内的行业领先的聊天机器人经常提供错误、令人困惑或可能伤害用户的建议。
最大的担忧是恶意行为者如何利用这个漏洞。虽然大多数用户永远不会要求有害的东西,但像这样的安全漏洞为危险的操纵打开了大门。
Android Authority 表示,它已要求 Google 对这些发现进行回应。如果一款被吹捧为能够与 GPT-5 相媲美的模型可以在几分钟内被破解,专家预计将出现一波安全更新,更严格的政策,以及可能删除一些高风险功能。
展望未来,开发人员面临着一个巨大的挑战:确保日益强大的人工智能仍然受到公众的控制,安全可靠。人工智能正在迅速发展 - 但保护用户的防御似乎仍然落后。
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)