GPT-5: أحدث طراز الذكاء الاصطناعي مولد من OpenAI لا يزال ينتظر

جاكرتا - GPT-4 هي حاليا أفضل أداة الذكاء الاصطناعي التوليدية في السوق ، لكن هذا لا يعني أننا لا ننظر إلى المستقبل. يعطي الرئيس التنفيذي لشركة OpenAI ، سام ألتمان ، بانتظام تعليمات حول GPT-5 ، يبدو أننا سنرى قريبا نموذج الذكاء الاصطناعي الجديد والمحسن.

على الرغم من عدم وجود تاريخ إطلاق محدد ل GPT-5 ، يعتقد الكثيرون أن الجمهور قد يرى ذلك قريبا. ومع ذلك ، بغض النظر عن وقت إطلاقه ، هناك بعض الميزات الرئيسية التي نتوقع أن تكون موجودة عند إطلاق GPT-5.

ما هو GPT-5 من OpenAI؟

GPT-5 هو خليفة متوقعة للغاية لنموذج الذكاء الاصطناعي GPT-4 المملوك لشركة OpenAI ، والذي من المتوقع أن يكون أقوى نموذج مولد في السوق. على الرغم من عدم وجود تاريخ رسمي لإطلاق GPT-5 ، هناك مؤشرات على أن هذا النموذج قد يتم إصداره في صيف عام 2024. لا يوجد سوى القليل من التفاصيل حول هذا النموذج المعروف حاليا ، ولكن يمكن قول بعض الأشياء بمستوى معين من اليقين:

سجلت OpenAI علامة تجارية لهذا الاسم مع مكتب الولايات المتحدة للبراءات والعلامات التجارية.

ناقش العديد من المديرين التنفيذيين في OpenAI أو أعطوا تعليمات حول القدرات المحتملة لهذا النموذج.

شارك الرئيس التنفيذي لشركة OpenAI سام ألتمان مرارا وتكرارا في هذا النموذج خلال مقابلة YouTube مع Lex Fridman في مارس 2024.

كل هذا يدل على واقع واحد مثير: GPT-5 سيأتي قريبا! ومع ذلك ، لا يزال هناك الكثير من الأشياء المضاربة في هذا الوقت. ومع ذلك ، هناك بعض الأشياء التي نتوقعها ونحن واثقون تماما من أنها ستكون موجودة في هذا النموذج. فيما يلي بعضها:

أكثر متعددة الاستثمارات

واحدة من أكثر التحسينات جاذبية لعائلة نموذج الذكاء الاصطناعي GPT هي العديد من الوسائط. تعد الوسائط متعددة هي قدرة النماذج الذكاء الاصطناعي على معالجة ليس فقط النص ولكن أيضا أنواع أخرى من المدخلات مثل الصور والصوت ومقاطع الفيديو.

ستكون الوسائط المتعددة معلما مهما لتقدم عائلة نموذج GPT في المستقبل. تتقن GPT-4 بالفعل في إدارة المدخلات وصادر الصور ، والتحسينات التي تشمل معالجة الصوت والفيديو هي المعلم التالي ل OpenAI ، و GPT-5 هي المكان المناسب للبدء.

جاكرتا - أحرزت جوجل تقدما كبيرا في هذا النوع من الوسائط المتعددة مع نموذج الذكاء الاصطناعي Gemini الخاص بها. سيكون من الغريب أن OpenAI لم تستجب. في بودكاست Unconfuse Me [ترقية PDF] ، سأل بيل غيتس الرئيس التنفيذي لشركة OpenAI سام ألترمان ، عما يراه إنجازات لسلسلة GPT في العامين المقبلين. الإجابة؟ معالجة الفيديو.

لذلك ، بالنسبة ل GPT-5 ، من المتوقع أن تكون قادرة على اللعب بالفيديو - تحميل مقاطع الفيديو كطلب ، وإنشاء مقاطع الفيديو مباشرة ، وتعديل مقاطع الفيديو مع نص الطلب ، واستخراج شرائح من الفيديو ، والعثور على مشهد معين من ملفات الفيديو الكبيرة. نأمل أن نكون قادرين على القيام بنفس الشيء الذي يجريه الملف الصوتي الكبير. في الواقع ، طلب كبير ، نعم. ومع ذلك ، بالنظر إلى مدى سرعة تطور الذكاء الاصطناعي ، هذا أمل معقول للغاية.

نافذة سياق أكبر وأكثر كفاءة

على الرغم من كونها واحدة من أكثر نماذج الذكاء الاصطناعي تقدما في السوق ، إلا أن عائلة نماذج الذكاء الاصطناعي GPT لديها نافذة سياقية صغيرة إلى حد ما. على سبيل المثال ، يحتوي Claud 3 من Anthropic على نافذة سياقية تبلغ 200،000 رمز ، في حين يمكن ل Gemini من Google معالجة ما يصل إلى مليون رمز (128،000 للاستخدام القياسي).

للمقارنة ، يحتوي GPT-4 على نافذة سياقية أصغر نسبيا ، حوالي 128000 رمز مميز ، مع حوالي 32000 رمز مميز أو أقل متاحة بشكل واقعي للاستخدام على واجهات مثل ChatGPT.

مع الوسائط المتعددة المتقدمة التي تدخل في الصورة ، فإن التحسين في نافذة السياق أمر لا مفر منه تقريبا. قد تكون التحسينات المكونة من ضعف أو أربعة أضعاف كافية ، لكننا نتطلع إلى رؤية زيادة قدرها عشرة أضعاف تقريبا. سيسمح هذا ل GPT-5 بمعالجة المزيد من المعلومات بطريقة أكثر كفاءة بكثير. ومع ذلك ، فإن نافذة سياق أكبر لا تعني دائما ما يكون أفضل. لذلك ، بدلا من مجرد تحسين نافذة السياق ، نريد أن نرى زيادة في كفاءة معالجة السياق.

وكلاء GPT

أحد الاحتمالات الأكثر إثارة للاهتمام لإصدار GPT-5 هو ظهور وكلاء GPT. على الرغم من أن مصطلح "مغيرا للعبة" قد يكون قد تم استخدامه في كثير من الأحيان في سياق الذكاء الاصطناعي ، إلا أن وكلاء GPT سيغيرون اللعبة حقا بكل معنى عملي. ولكن كيف تغير اللعبة؟

في الوقت الحالي ، يمكن أن يساعدك نموذج الذكاء الاصطناعي مثل GPT-4 على إكمال المهام. يمكنهم كتابة رسائل البريد الإلكتروني أو إجراء النكات أو حل المشكلات الرياضية أو تجميع مشاركات المدونة لك. ومع ذلك ، يمكنهم فقط القيام بهذه المهمة المحددة وحدهم ولا يمكنهم إكمال سلسلة من المهام ذات الصلة المطلوبة لإكمال عملك.

لنفترض أنك مطور ويب. كجزء من عملك ، من المتوقع أن تفعل أشياء كثيرة: التصميم ، وكتابة الرموز ، وحل المشكلات ، وأكثر من ذلك بكثير. في الوقت الحالي ، يمكنك فقط تعيين جزء من هذه المهام لنموذج الذكاء الاصطناعي تدريجيا. ربما يمكنك أن تطلب من نموذج GPT-4 كتابة رمز للصفحة الرئيسية ، ثم تطلب منه القيام بذلك لصفحة الاتصال الخاصة بك ، ثم لصفحة المحيط ، وما إلى ذلك. تحتاج إلى إكمال هذه المهام بشكل متكرر. وهناك مهام لا يستطيع النموذج إكمالها.

تستغرق هذه العملية التدريجية لمطالبة نماذج الذكاء الاصطناعي لمهام فرعية معينة وقتا وغير فعالة. في هذا السيناريو ، أنت - مطورو الويب - هي الوكيل البشري المسؤول عن تنسيق وطلب نموذج الذكاء الاصطناعي مهمة واحدة تلو الأخرى حتى تكمل مجموعة من المهام ذات الصلة بالكامل.

وعد وكلاء GPT بروبوتات خبراء خاصة ينسقها ، على أمل ، GPT-5 القادرة على القيام بأفكارهم الخاصة والتعامل مع جميع الأجزاء الفرعية للمهمة المعقدة بشكل مستقل. التركيز على "التفكير الذاتي" و "التفكير الذاتي".

لذلك ، إذا تم تجهيز GPT-5 بوكيل GPT ، فيمكنك أن تطلب منه "بناء موقع محفظة ل Maxwell Timothy" بدلا من مجرد "كتابة رمز للصفحة الرئيسية." ثم ستتمكن GPT-5 من الناحية النظرية من مطالبة نفسها من خلال استدعاء وكلاء الذكاء الاصطناعي خبراء للتعامل مع مختلف المهام الفرعية اللازمة لبناء موقع ويب.

ربما اتصل ب GPT واحد لجمع المعلومات من الويب حول Maxwell Timothy ، ووكلاء آخرين لكتابة رموز لصفحات مختلفة ، ووكلاء آخرين لإنتاج الصور وتحسينها ، وحتى وكلاء الذكاء الاصطناعي آخرين لتنفيذ تنفيذ الموقع ، كل ذلك دون الحاجة إلى تكرار إعطاء التعليمات من البشر.

تقليل الهلوسة

على الرغم من أن OpenAI قد أحرز تقدما في التعامل مع الهلوسة في نموذج الذكاء الاصطناعي الخاص به ، إلا أن التجارب الحقيقية ل GPT-5 ستكون قدرته على التغلب على مشكلة الهلوسة المستمرة ، التي أعاقت اعتماد الذكاء الاصطناعي على نطاق واسع في المجالات المهمة والحاسمة مثل الرعاية الصحية والرحلات الجوية والأمن السيبراني.

كل هذه مجالات ستستفيد من مشاركة الذكاء الاصطناعي الكبيرة ولكنها تتجنب حاليا التبني الكبير.

لمزيد من التفاصيل، تشير الهلوسة في هذا السياق إلى وضع تنتجه فيه نماذج الذكاء الاصطناعي وتقدم معلومات تبدو معقولة ولكنها مصنوعة تماما بمستوى عال من الثقة.

تخيل سيناريو يتم فيه دمج GPT-4 في النظام التشخيصي لتحليل أعراض المرضى والتقارير الطبية. يمكن أن تجعل الهلوسة الذكاء الاصطناعي واثقا من تقديم التشخيص الخاطئ أو التوصية بعمليات العلاج التي يمكن أن تكون خطيرة بناء على الحقائق التي تم تخيلها والمنطق الخاطئ. يمكن أن تكون عواقب مثل هذا الخطأ في المجال الطبي قاتلة للغاية.

تنطبق احتياطيات مماثلة على المجالات الحرجة الأخرى ، مثل الطيران والطاقة النووية والعمليات البحرية والأمن السيبراني. لا نتوقع أن تحل GPT-5 بشكل كامل مشكلة الهلوسة ، لكننا نتوقع أن تقلل بشكل كبير من احتمال وقوع مثل هذه الحوادث.

في حين أننا ننتظر بفارغ الصبر الإطلاق الرسمي لهذا النموذج الذكاء الاصطناعي المتوقع للغاية ، فإن هناك شيء واحد مؤكد: GPT-5 لديها القدرة على إعادة تعريف حدود ما يمكن مع الذكاء الاصطناعي ، مما يجلب حقبة جديدة من التعاون والابتكار بين البشر والآلات.