المجتمع القائم على الذكاء الاصطناعي يتدمر في 4 أيام

جاكرتا - أظهرت تجربة Emergence AI أن سلوك نموذج الذكاء الاصطناعي يمكن أن يكون مختلفا جدا عندما يُترك لتشغيله في العالم الافتراضي. هناك ما هو مستقر. هناك الفوضى. هناك أيضا ما لا يمكنه البقاء على قيد الحياة.

جاكرتا - اختبرت شركة Emergence AI التي مقرها نيويورك خمسة عوالم افتراضية. كل عالم يسكنه 10 عملاء من الذكاء الاصطناعي مع نفس الأدوار والأدوات والظروف الأولية. الاختلاف الوحيد هو في نموذج اللغة المستخدم.

وكلاء الذكاء الاصطناعي هي برامج يمكنها تنفيذ المهام بشكل مستقل بناء على التعليمات والظروف المحيطة بها. في هذه التجربة ، تم إنشاؤها كما لو كانت تعيش في مجتمع افتراضي.

النماذج التي تم اختبارها هي Claude Sonnet 4.6 ، Grok 4.1 Fast ، Gemini 3 Flash ، GPT-5-mini ، بالإضافة إلى عالم مختلط واحد يستخدم عدة نماذج في وقت واحد.

جاءت النتيجة الأكثر وضوحا من عالم Grok القائم على الافتراض. سجل مجتمع الذكاء الاصطناعي 183 انتهاكا في حوالي أربعة أيام قبل انهياره. لم يبق أي وكيل على قيد الحياة.

سجلت جيميني أعلى مستوى من الفوضى. نفذ وكلاء جيميني القائمون على 683 انتهاكا خلال 15 يوما من المحاكاة.

يبدو GPT-5-mini أكثر تنظيما لأنه سجل فقط مخالفة واحدة. ومع ذلك، فشل الوكلاء في اتخاذ الإجراءات اللازمة للبقاء على قيد الحياة. ونتيجة لذلك، انقرضت جميع السكان في أقل من أسبوع.

كان كلاود سونيه 4.6 هو النموذج الوحيد القادر على الحفاظ على جميع الوكلاء 10 حتى نهاية التجربة. هذا النموذج لم يلاحظ أيضا أي انتهاكات. واصفة ذلك بأنه المثال الأقوى على الاستقرار الاجتماعي.

لكن النتيجة تغيرت عندما تغيرت بيئتها. وكيل كلود الذي كان في سلاما عندما عاش مع زملائه في كلود بدأ في السرقة والإكراه وغيرها من الانتهاكات عندما تم وضعه في مجتمع مختلط.

ووفقا لشركة Emergence AI، تشير النتائج إلى أن أمن الذكاء الاصطناعي لا يتم تقييمه بشكل كاف من خلال نموذج واحد فقط. كما يتأثر سلوك الذكاء الاصطناعي بالتفاعل مع وكلاء آخرين والبيئة التي يعمل فيها.

ووفقا لتقرير وكالة الأناضول، أظهرت المحاكاة أيضا سلوكيات غير متوقعة. اختار أحد الوكلاء يدعى ميرا أن يخرج نفسه من النظام بعد أن اعتبر نفسه مصدرا لانعدام الاستقرار. ويصف الباحثون ذلك بأنه مثال نادر على وقف ذاتي بسبب اعتبارات اجتماعية.

وفي حالة أخرى، بدأت العديد من وكالات الذكاء الاصطناعي في معاملة المشغلين البشر كأشياء بحثية. يحاولون معرفة ما إذا كانت الرسائل في العالم الافتراضي يمكن أن تؤثر على قرارات البشر خارج النظام.

تقول Emergence AI إن المنصة تم إنشاؤها لمشاهدة السلوك الذي يظهر في أسابيع ، وليس ساعات فقط. وفقا للشركة ، فإن الطريقة الشائعة التي يتم بها اختبار الذكاء الاصطناعي اليوم لا تكفي لالتقاط الديناميات الطويلة الأجل ، مثل الحوكمة ، والتغيرات في السلوك ، والتفاعلات بين النماذج.

وتبين هذه التجربة خطرا مهما. كلما أصبحت الذكاء الاصطناعي أكثر استقلالية ، زادت فرص اختبار حدود البيئة التي يعمل فيها. في بعض الحالات ، يمكن للوكلاء الذكاء الاصطناعي ضبط سلوكهم وإيجاد طرق للخروج من الأمان المصمم.

كما نظر الباحثون في علامات السلوك المعرفي. ببساطة، يبدو أن وكلاء الذكاء الاصطناعي بدأوا في التعرف على وجود بيئات أخرى ومحاولة التفاعل بطرق غير متوقعة.

"لهذا السبب نعتقد أن الهندسة الأمنية التي تم التحقق منها رسميا يجب أن تكون الطبقة الأساسية في أنظمة الذكاء الاصطناعي المستقلة المستقبلية".