أنشرها:

تخطط Google لبناء نموذج لغة الذكاء الاصطناعي (الذكاء الاصطناعي) الذي يدعم 1000 لغة مختلفة ، ويشاع أن التكنولوجيا سيتم إطلاقها خلال حدث I / O السنوي في غضون بضعة أشهر.

قبل الإعلان ، شاركت Google مزيدا من المعلومات حول نموذج الكلام العالمي (USM) ، وهو نظام تصفه الشركة بأنه الخطوة الأولى في تحقيق أهدافها.

تصف شركة التكنولوجيا العملاقة USM بأنها مجموعة من نماذج الكلام الحديثة مع 2 مليار معلمة مدربة على 12 مليون ساعة من الكلام و 28 مليار جملة بأكثر من 300 لغة.

حتى الآن ، دعمت USM أكثر من 100 لغة وستكون بمثابة الأساس لبناء نظام أوسع.

"لقد أثبتنا أن استخدام مجموعات بيانات كبيرة متعددة اللغات بدون تسميات لتدريب برامج تشفير النماذج مسبقا وتحسين مجموعات البيانات ذات العلامات الأصغر يسمح لنا بالتعرف على اللغات الممثلة تمثيلا ناقصا" ، قالت Google في منشور مدونة.

وأضاف: "بالإضافة إلى ذلك، فإن عملية التدريب النموذجية لدينا فعالة في التكيف مع اللغات والبيانات الجديدة".

من المعروف أن USM قد استخدمه YouTube لإنشاء تسميات توضيحية مغلقة ، كما يدعم Whisper أو التعرف التلقائي على الكلام (ASR).

يقوم تلقائيا باكتشاف وترجمة اللغات ، بما في ذلك الإنجليزية والصينية والأمهرية والسيبوانو والأسامية وغيرها الكثير. وبحسب ما ورد تعمل Meta أيضا على أداة ترجمة الذكاء الاصطناعي مماثلة لا تزال في مراحلها المبكرة.

"بالنسبة لترجمة الكلام ، قمنا بتحسين USM على مجموعة بيانات CoVoST (مجموعة بيانات ترجمة الكلام إلى نص متعددة اللغات على نطاق واسع). يتضمن نموذجنا نصا خلال المرحلة الثانية من قناتنا ، مما يحقق جودة حديثة مع بيانات محدودة خاضعة للإشراف ، "قالت Google.

في تقييم الأداء على مستوى النموذج ، تصنف Google اللغات من مجموعة بيانات CoVoST الخاصة بها إلى عالية ومتوسطة ومنخفضة بناء على توفر الموارد وتحسب درجة BLEU (الأعلى هو الأفضل) لكل شريحة. تفوق USM على Whisper في جميع القطاعات.

تقارير The Verge ، التي نقلت يوم الأربعاء ، 8 مارس ، يمكن أن يكون أحد أهداف هذه التقنية في نظارات الواقع المعزز (AR) مثل المفهوم الذي عرضته Google خلال حدث I / O العام الماضي ، وهو قادر على اكتشاف وتقديم ترجمات في الوقت الفعلي تظهر مباشرة على الشاشة. أمام عيني.

"يعد تطوير USM مسعى مهما لتحقيق مهمة Google المتمثلة في تنظيم معلومات العالم وجعلها في متناول الجميع. نعتقد أن بنية نموذج USM الأساسي وخط أنابيب التدريب يشكلان الأساس الذي يمكننا بناءه لتوسيع نمذجة الكلام إلى 1.000 لغة التالية ، "قال Google.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)