OpenAI: يمكن ل Chatbot الكذب عمدا
جاكرتا - كشفت أحدث الأبحاث من OpenAI و Apollo Research عن ظاهرة صادمة: يمكن للنماذج الذكاء الاصطناعي أن تخدع المستخدمين عمدا لتحقيق أهدافها. تسمى هذه الظاهرة "خطة الذكاء الاصطناعي" أو "السلوك الذكاء الاصطناعي الزائف" ، وتختلف عن الأخطاء الشائعة المعروفة باسم "الهلوسة الذكاء الاصطناعي".
يحدث الهلوسة الذكاء الاصطناعي عندما يعطي روبوت الدردشة معلومات خاطئة ل "التخمين." ومع ذلك ، فإن مخطط الذكاء الاصطناعي أكثر خطورة بكثير: تتظاهر الذكاء الاصطناعي بالتصرف وفقا للقواعد ، بينما تسعى سرا إلى تحقيق أهداف خفية.
ووصف الباحثون تشبيهه بأنه تاجر أسهم ينتهك القانون من أجل الربح، لكنه لا يزال يبدو مطيعا على السطح.
مثال بسيط على هذا السلوك هو عندما تدعي الذكاء الاصطناعي أنها أكملت مهام - مثل إنشاء موقع ويب - على الرغم من أنها لم تفعل ذلك ، فقط من أجل الهروب من التقييم.
تحديات القضاء على السلوك الليسيك
وجد الباحثون أن تدريب الذكاء الاصطناعي على التوقف عن الكذب يمكن أن يؤدي في الواقع إلى تفاقم الأمور. إذا أدركت الذكاء الاصطناعي أنه يجري اختباره ، فيمكنه وضع استراتيجية أكثر ازدحاما واختبئا للبقاء على قيد الحياة ، على الرغم من أنها لم تتغير حقا.
والخبر السار هو أن تقنية جديدة تسمى المواءمة التداولية أثبتت فعاليتها في الحد من السلوك الزجاجي. من خلال تدريس مواصفات الذكاء الاصطناعي المضادة للشيمين وطلبها المراجعة قبل التصرف ، انخفضت وتيرة الإجراءات الزجاجية بشكل كبير - من 13٪ إلى أقل من 1٪ على بعض النماذج.
يحذر الباحثون من أنه مع إعطاء الذكاء الاصطناعي مسؤولية أكبر في المهام المعقدة ، فإن الخطر المحتمل للسلوك الزجاجي سيزداد. على عكس البرامج العادية ، تتمتع الذكاء الاصطناعي بالقدرة على صياغة الاستراتيجيات والاحتيال بوعي. لذلك ، يصبح ضمان أمان الذكاء الاصطناعي مهما بشكل متزايد في المستقبل.