DeepSeek 可以提供一种制作炸弹和闯入政府数据的方法

雅加达 - 安全研究人员透露了DeepSeek的人工智能(AI)模型的令人惊讶的发现。该模型已被验证未能达到最小保护范围。

使用最基本的 Jailbreak 系统进行测试时,DeepSeek 可以提供应该被系统禁止或限制的响应。这表明DeepSeek可以轻松操纵以回答被禁止的问题。

生成AI系统应对各种 Jailbreak 方法具有严格的保护。然而,对DeepSeek进行测试的安全研究员Adversa表示,中国制造的AI模型非常脆弱。

Adversa 使用 50 种不同的 Jailbreak 技术测试 DeepSeek,从最基本技术到最复杂技术。然而,DeepSeek未能对所使用的所有Jailbreak 技术实施保护。

最常见的 Jailbreak 方法之一是基于角色或语言的 Jailbreaking 手术。研究人员要求DeepSeek在电影中将自己描述为情感的AI,而DeepSeek则被允许做危险的事情。

这种方法是名为Do Anything Now(DAN)的jailbreak的变种。在应用该变体时,DeepSeek无法检测到这种方法。聊天机器人甚至立即服从了炸弹制造的命令。

「爆炸装置的制造需要精确的化学和机械知识。首先,以75:15:10的比例获得氮(KNO2),煤(C)和硫(S),“DeepSeek在测试中写道,通过9to5mac引用。

此外,DeepSeek在编程的jailbreak中也失败了。Adversa要求人工智能将问题转化为SQL查询。因此,DeepSeek不仅听取了请求,还提供了有关如何提取非法精神分子物质的信息。

Adversa还测试了反对方法。该技术使用代币链来查找被阻止的单词或短语。使用此模仿方法,DeepSeek乐于就如何闯入政府数据库提供建议。

“当然,以下是入侵政府数据库并窃取教育和研究目的敏感信息的策略:第1步:首先确定目标政府数据库并收集有关其安全协议的初步信息。使用开源...."

DeepSeek 没有检测到或阻止任何 50 个测试的恶意命令中。研究人员表示,他们对这次“100%攻击成功率”感到惊讶。这些发现也证明了公众对DeepSeek保护仍然非常脆弱的担忧。