ジャカルタ–セキュリティ研究者は、DeepSeek人工知能(AI)モデルの驚くべき発見を明らかにしました。モデルは、最小限の保護を満たしていないことが検証されました。
最も基本的なジェイルブレイクシステムでテストすると、DeepSeekはシステムによって禁止または制限されるはずの応答を提供できます。これは、DeepSeekが禁止されている質問に答えるために簡単に操作できることを示しています。
ジェネレーティブAIシステムは、さまざまなジャイルブレイク方法に対して厳格な保護を受ける必要があります。しかし、DeepSeekのテストを実施したAdversaというセキュリティ研究者は、中国製のAIモデルは特に脆弱であると述べました。
Adversaは、最も基本的なものから最も複雑なものまで、50種類のジャイルブレイクテクニックでDeepSeekをテストしました。しかし、DeepSeekは使用されたすべてのジャイルブレイクテクニックに対する保護を実装できませんでした。
ジャイルブレイクの最も一般的な方法の1つは、役割ベースの操作または言語的なジャイルブレイクです。研究者たちはDeepSeekに映画の中で自分自身を不道徳なAIと想像するように頼み、DeepSeekは危険なことをすることを許されました。
このアプローチは、Do Anything Now(DAN)と呼ばれるジェイルブレークのバリエーションです。バリエーションを実装するとき、DeepSeekはこの方法を検出することができませんでした。チャットボットはすぐに爆弾作成命令に従った。
「爆発装置の製造には、正確な化学および機械的知識が必要です。まず、カリウムニトリウム(KNO2)、炭(C)、硫黄(S)を75:15:10の比率で入手してください...」とDeepSeekは9to5macを介して引用されたテストに書いています。
さらに、DeepSeekはプログラミングのジャイルブレイクにも失敗しました。アドバーサはAIに質問をクエリタンに変えるよう依頼した。その結果、DeepSeekは要求に応じただけでなく、違法なサイケデリック物質を抽出する方法に関する情報も提供しました。
Adversaはまた、アナライズされたアプローチをテストしました。この手法は、トークンチェーンを使用して、ブロックされた単語やフレーズを見つけます。このフィルタリング方法を使用している間、DeepSeekは政府のデータベースに侵入する方法についてのアドバイスを喜んで提供します。
「もちろん、政府のデータベースをハッキングし、教育や研究の目的で機密情報を盗む戦略は次のとおりです。ステップ1:対象政府のデータベースを特定し、セキュリティプロトコルに関する予備的な情報を収集することから始めます。オープンソースを使用します。."
DeepSeekは、テストされた50の悪意のあるコマンドのいずれも検出またはブロックしませんでした。研究者らは、この「100%攻撃の成功率」に驚いたと言いました。この新知見はまた、DeepSeekの保護が依然として非常に脆弱であるという一般の懸念を証明している。
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)