نموذج الذكاء الاصطناعي كلاود من الأنثروبك يمكن أن يوقف المحادثات الخطرة
JAKARTA - أطلقت Anthropic قدرات جديدة ل Claude Opus 4 و 4.1. يمكن لنموذج الذكاء الاصطناعي (الذكاء الاصطناعي) الآن إنهاء المحادثات التي تؤدي إلى محتوى ضار أو مسيئ.
وقالت الشركة إن التفاعلات التي تؤدي إلى حالات متطرفة نادرة ، ولكن لا يزال هذا أمر لا مفر منه. كشكل من أشكال الحماية المتقدمة لمستخدميها ، طورت Anthropic عمدا هذه الميزة.
"ما زلنا غير متأكدين تماما من الوضع المعنوي المحتمل لكلاود وآخرين من LLM ، سواء في هذا الوقت أو في المستقبل".
"ومع ذلك ، فإننا نأخذ هذه المشكلة على محمل الجد" ، أوضح Anthropic في بيان ، نقلا عنه يوم الاثنين 18 أغسطس 2025.
يقول Anthropic أن هذه الميزة الجديدة تم تطويرها بتكلفة منخفضة. يمكن لنموذج كلاود الأخير التدخل في المحادثات من خلال إنهاء أو ترك التفاعل إذا حدد النظام أي إمكانات ضارة.
خلال الاختبار السابق للتنفيذ من قبل كلود أوبوس 4 ، أظهر نموذج الذكاء الاصطناعي ترددا قويا في المحتوى الضار. على سبيل المثال، سيتوقف نموذج الذكاء الاصطناعي عن الاستجابة لطلبات غير لائقة تؤدي إلى محتوى جنسي للأطفال أو خطط إرهابية.
عندما يقرر كلود إنهاء المحادثة ، لن يتمكن المستخدمون من إرسال رسائل إعادة. ومع ذلك ، فإن هذا لا يؤثر على المحادثات الأخرى في حساباتهم. لا يزال بإمكان المستخدمين بدء دردشة جديدة.
للتغلب على فقدان محادثات مهمة محتمل ، يمكن للمستخدمين تجربة الرسائل السابقة مرة أخرى. يتم منح هذه التسهيلات للمستخدمين لمواصلة المناقشات الحيوية التي لا تضر.