جاكرتا - طور باحثو الذكاء الاصطناعي في Google طريقة مبتكرة لتحسين أداء نماذج اللغات الأجنبية
طورت Google DeepMind طريقة نموذج اللغة الكبيرة (LLM) (الصورة: x @GoogleDeepMind)

أنشرها:

جاكرتا - طورت باحثة الذكاء الاصطناعي (الذكاء الاصطناعي) من Google Research و Google DeepMind طريقة يمكن فيها تعزيز نماذج اللغة الكبيرة (LLM) من خلال نماذج اللغة الأخرى.

وهي تتعامل مع واحدة من أكبر المشاكل التي لا تزال قائمة مع LLM من خلال السماح للمطورين بتوفير مهارات جديدة على النماذج الحالية دون الحاجة إلى البدء من الصفر أو إشراك جلسات تدريبية / تقدمية باهظة الثمن.

وفقا لفريق Google Research ، فإن تعزيز LLM مع نماذج اللغات الأخرى لا يحسن الأداء على المهام الحالية فحسب ، بل يسمح أيضا بالمهام الجديدة التي لا يمكن للنموذج نفسه إنجازها.

يتم إجراء تدريس حيل جديدة على روبوت الدردشة القديم باستخدام PaLM2-S LLM من Google ، وهو نموذج يقال إنه يعادل GPT-4 ، الذكاء الاصطناعي الذي هو أساس OpenAI ChatGPT.

تم اختبار PaLM2-S بنفسه في تجارب الفريق ثم أعيد اختباره بعد تعزيزه بنمط لغة أصغر وتحديدا. وشملت المهام التي تم تنفيذها الترجمة، حيث أظهرت الإصدارات المعززة زيادة بنسبة تصل إلى 13٪ مقارنة بالخط الأساسي، والبرمجة.

عند اختباره في مهام البرمجة ، يظهر هذا النموذج الهجين زيادة كبيرة ، كما هو موضح في الورقة:

"وبالمثل ، عندما يتم تعزيز PaLM2-S من خلال نموذج مخصص للبرمجة ، نشهد زيادة نسبية بنسبة 40٪ مقارنة بالنموذج الأساسي لمهام الجيل وتفسير الرموز - مقارنة بالنموذج المتقدم بالكامل."

الآثار المحتملة الكبيرة بشكل مباشر ، يمكن أن يكون للتحسينات في الأداء المعروضة تأثير مباشر على قطاع الذكاء الاصطناعي. على سبيل المثال، تبين أن التحسينات في الأداء في مهام الترجمة هي الأكبر عند ترجمة اللغات بدعم منخفض إلى الإنجليزية. لا تزال هذه قضية لم يتم حلها في التعلم الآلي ، وأبحاث Google هنا لديها القدرة على تقديم مساهمة كبيرة.

ومع ذلك ، على نطاق أوسع ، من الممكن أن يعالج هذا الخط من الأبحاث القضايا القانونية التي تهدد العديد من الرؤساء التنفيذيين للتكنولوجيا في قطاع الذكاء الاصطناعي: القضايا القانونية التي يمكن أن تدمر أساسيات أروبوتات الدردشة مثل ChatGPT.

في الوقت الحالي ، أصبح صانعو بعض نماذج اللغة الكبيرة الأكثر شعبية متهمين في العديد من الدعاوى القضائية التي تعتمد على الادعاءات بأن هذا النظام الذكاء الاصطناعي يتم تدريبه باستخدام بيانات محمية بحقوق الطبع والنشر.

السؤال الذي يجب أن يجيب عليه المشرعون والمحاكم هو ما إذا كانت الشركات الموجهة نحو الربح يمكنها استخدام هذه البيانات بشكل قانوني لتدريب نموذج اللغة الخاص بها. إذا حكمت المحكمة بأن المطور لا يستطيع استخدام البيانات وأن النماذج المدربة بمواد حقوق الطبع والنشر يجب إزالتها ، فقد يكون من المستحيل تقنيا أو غير الممكن اقتصاديا الاستمرار في تقديم الخدمات المتأثرة.

في الأساس ، نظرا للتكلفة المرتفعة المشاركة في تدريب نماذج اللغات الكبيرة واعتمادها على البيانات الكبيرة ، قد لا تكون منتجات مثل ChatGPT ، كما يتم بناؤها حاليا ، قابلة للتطبيق في مشهد ذكاء أمريكي أكثر تنظيما.

ومع ذلك ، إذا نجح خطة ترقية LLM جديدة من Google مع مزيد من التطوير ، فمن المحتمل أن العديد من المتطلبات والتكاليف لبدء LLM من الصفر أو النهوض بالمسؤولية القائمة يمكن تخفيضها.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)