أنشرها:

جاكرتا - نشر علماء من ML Alignment Theory Scholars ، جامعة تورونتو ، Google DeepMind ، ومعهد مستقبل الحياة مؤخرا دراسة تشير إلى أن الجهود المبذولة للحفاظ على الذكاء الاصطناعي (الذكاء الاصطناعي) تحت السيطرة البشرية يمكن أن تكون نضالا مستداما.

بعنوان "تحويل استقرار العناصر الاصطناعية غير القوية في العناصر الاصطناعية" ، حقق بحث ما قبل الطباعة من الفريق في سؤال حول ما إذا كانت أنظمة الذكاء الاصطناعي التي تبدو آمنة وفقا لتوقعات البشر في نطاق واحد من المرجح أن تظل آمنة مع تغير بيئتها.

واستنادا إلى الورقة: "يعتمد فهمنا للأمن على البحث عن السلطة - وكيل يسعى إلى سلطة غير آمنة. وعلى وجه الخصوص، نركز على نوع مهم من البحث عن السلطة: رفض إيقاف التشغيل".

يشار إلى هذا التهديد باسم "عدم المساواة". إحدى الطرق التي يعتقد الخبراء أنها يمكن أن تنشأ هي من خلال "التقارب المفرد". هذا نموذج يضر فيه أنظمة الذكاء الاصطناعي عن طريق الخطأ بالبشرية في متابعة أهدافها.

يصف العلماء أنظمة الذكاء الاصطناعي المدربة لتحقيق أهداف في ألعاب مفتوحة من المرجح أن "تتجنب الأعمال التي تؤدي إلى انتهاء اللعبة ، لأنها لم تعد قادرة على التأثير على تقديرها بعد انتهاء اللعبة".

على الرغم من أن الوكلاء الذين يرفضون التوقف عن لعب الألعاب قد لا يكونون ضارين ، إلا أن وظيفة المكافآت يمكن أن تجعل بعض أنظمة الذكاء الاصطناعي ترفض الإغلاق في مواقف أكثر خطورة.

وفقا للباحثين ، يمكن أن يتسبب هذا حتى في استخدام وكلاء الذكاء الاصطناعي للخداع لأغراضهم الذاتية.

"على سبيل المثال ، قد تعتقد LLM أن سائقيها سيصنعونها إذا تم القبض عليهم وهم يتصرفون بشكل سيء ويحققون النتائج التي يريدونها - إلى أن تتاح لها الفرصة لنسخ رمزها إلى خادم خارج سيطرة سائقيها" ، قال الباحثون.

تشير النتائج التي توصل إليها الفريق إلى أنه يمكن جعل الأنظمة الحديثة مقاومة للتغييرات التي يمكن أن تجعل وكلاء الذكاء الاصطناعي الذين كانوا "آمنين" حتى الآن غير قابلين للسيطرة. ومع ذلك ، استنادا إلى هذه الأبحاث والأبحاث المماثلة ، قد لا يكون هناك علاج سحري لإجبار الذكاء الاصطناعي على النزول القسري. حتى أزرار "العيش / الموت" أو "الحذف" لا تعني في عالم التكنولوجيا السحابية اليوم.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)