أنشرها:

جاكرتا - حققت OpenAI مرة أخرى اختراقا من خلال أحدث طراز لها ، GPT-5. في تجربة حديثة باستخدام معيار يسمى GDPval ، تم اختبار هذا الذكاء الاصطناعي في مجموعة متنوعة من الأعمال الحقيقية في تسع صناعات مهمة. النتائج مذهلة للغاية: GPT-5 قادر على مطابقة أو تجاوز أداء المهنيين بنسبة تصل إلى 40٪ من إجمالي الاختبارات.

تم تصميم معايير GDPval لقياس أداء النماذج الذكاء الاصطناعي على المهام التي يقوم بها البشر عادة في عالم العمل. أوضحت OpenAI أن هذه الاختبارات تشمل العمل من القطاعات الصحية والمالية والتصنيع والحكومية. لا تقتصر المهام المعطاة على المحاكاة ، ولكنها مأخوذة تماما من ممارسات العمل الحقيقية.

في أحد الاختبارات ، على سبيل المثال ، يطلب من المحترفين مقارنة التقارير التي أعدها البشر بتقرير الذكاء الاصطناعي. هناك أيضا اختبار في مجال الخدمات المصرفية الاستثمارية ، حيث يطلب من المشاركين إجراء تحليل منافس في صناعة التوصيل لمسافات طويلة ، ثم يتم مطابقة النتائج مع تقرير GPT-5.

ونتيجة لذلك ، أصبح GPT-5 نموذجا مفتوحا للذكاء الاصطناعي بأفضل أداء حتى الآن. في 40.6٪ من الحالات ، يعتبر هذا الناتج من الذكاء الاصطناعي يعادل أو أفضل من عمل الخبراء في مجاله. ومع ذلك ، لاحظت OpenAI أيضا أن منافستها ، كلود الذكاء الاصطناعي من Anthropic ، سجلت أرقاما أعلى بنسبة 49٪. ومع ذلك ، وفقا ل OpenAI ، هذا جزئيا لأن كلود أكثر مهارة في إنتاج صور ورسومات جذابة.

إذن ، هل يعني هذا أن الذكاء الاصطناعي سيحل قريبا محل البشر؟ تؤكد OpenAI أن هذا لم يحدث في المستقبل القريب. وفقا للدكتور آرون شاترجي ، كبير الاقتصاديين في OpenAI ، فإن هدف GDPval ليس إثبات أن الذكاء الاصطناعي يمكن أن يتولى بالكامل العمل البشري. من ناحية أخرى ، من المتوقع أن يكون الذكاء الاصطناعي أداة داعمة حتى يتمكن البشر من التركيز أكثر على الأعمال عالية القيمة.

على سبيل المثال ، فإن مهمة تجميع التقارير القائمة على البيانات التي تستغرق عادة ساعات ، يمكن إكمالها بواسطة GPT-5 في دقائق. وبهذه الطريقة، يمكن للعمال تخصيص وقتهم لأشياء أكثر استراتيجية أو إبداعا أو حتى شخصية.

يمثل هذا الإنجاز GPT-5 مرحلة انتقالية في عالم العمل. وبدلا من النظر إليها على أنها تهديد، تشجع OpenAI على استخدام الذكاء الاصطناعي كشريك يمكن أن يزيد من الإنتاجية مع فتح المجال للبشر للقيام بأشياء أكثر أهمية.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)