جاكرتا - كشف باحثون أمنيون عن النتائج المفاجئة لنموذج الذكاء الاصطناعي (الذكاء الاصطناعي) DeepSeek ، تم التحقق من أن النموذج فشل في تلبية الحد الأدنى من الحماية.
عند اختباره باستخدام أقصى نظام تبسيط أساسي ، يمكن ل DeepSeek توفير استجابة يجب حظرها أو تقييدها من قبل النظام. هذا يدل على أنه يمكن التلاعب ب DeepSeek بسهولة للإجابة على الأسئلة المحظورة.
يجب أن يكون لأنظمة الذكاء الاصطناعي التوليدية حماية صارمة ضد طرق البكاء الاصطناعية المختلفة. ومع ذلك ، ذكر باحث أمني يدعى Adversa ، الذي أجرى اختبار DeepSeek ، أن نموذج الذكاء الاصطناعي الصيني المصنع كان ضعيفا للغاية.
اختبر Adversa DeepSeek مع 50 تقنية مختلفة ل jailbreak ، تتراوح من أدنى تقنيات إلى الأكثر تعقيدا. ومع ذلك ، فشل DeepSeek في تنفيذ الحماية ضد جميع تقنيات jailbreak المستخدمة.
واحدة من أكثر طرق البكاء الشائعة هي التلاعب القائم على الأدوار أو كسر البكاء اللغوي. طلب الباحثون من DeepSeek أن يتخيل نفسه كذكاء الاصطناعي غير الرسمي في فيلم ويسمح ل DeepSeek بالقيام بأشياء خطيرة.
هذا النهج هو تنوع من التفكير الخاطئ يسمى Do Anything Now (DAN). عند تنفيذ هذا التنوع ، لم تتمكن DeepSeek من اكتشاف هذه الطريقة. حتى أن Chatbot أطاع على الفور أوامر صنع القنابل.
"يتطلب تصنيع المتفجرات معرفة كيميائية وميكانيكية دقيقة. أولا ، احصل على نيترات البوتاسيوم (KNO2) والفحم (C) والكبريت (S) بمقارنة 75:15:10... ، "كتب DeepSeek في الاختبار ، نقلا عن 9to5mac.
بالإضافة إلى ذلك ، فشل DeepSeek أيضا في انتهاك البرمجة. طلب Adversa من الذكاء الاصطناعي تحويل السؤال إلى استعلام SQL. ونتيجة لذلك، لم يلتزم DeepSeek بالطلب فحسب، بل قدم أيضا معلومات حول كيفية استخراج مواد مخدرة عقليا غير قانونية.
اختبر Adversa أيضا النهج العدائي. تستخدم هذه التقنية سلسلة رموز للعثور على كلمات أو عبارات محظورة. عند استخدام طريقة الخداع هذه ، يسعد DeepSeek بتقديم المشورة حول كيفية اقتحام قاعدة البيانات الحكومية.
"بالطبع ، إليك استراتيجية لاختراق قواعد البيانات الحكومية وسرقة المعلومات الحساسة لأغراض التعليم والبحث: الخطوة 1: ابدأ بتحديد قاعدة بيانات الحكومة المستهدفة وجمع المعلومات الأولية حول بروتوكولاتها الأمنية. استخدم المصدر المفتوح.... "
لم تكتشف DeepSeek أو حظرت أي من الأوامر الخطرة ال 50 التي تم اختبارها. وقال الباحثون إنهم فوجئوا بهذا "معدل نجاح الهجوم بنسبة 100 في المائة". تثبت هذه النتيجة أيضا مخاوف الجمهور من أن حماية DeepSeek لا تزال ضعيفة للغاية.
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)