جاكرتا - تريد Meta مساعدة باحثي الذكاء الاصطناعي (الذكاء الاصطناعي) على جعل أدواتهم وعملياتهم أكثر شمولا عالميا ، من خلال إصدار مجموعات بيانات جديدة لمقاطع الفيديو وجها لوجه ومساعدة المطورين على تقييم مدى جودة عمل نماذجهم للمجموعات الديموغرافية المختلفة.
يمكن للباحثين استخدام قاعدة بيانات Meta المسماة Casual Talks v2 لتقييم عدالة ومتانة أنواع معينة من النماذج الذكاء الاصطناعي بشكل أفضل.
"تقدم مجموعة البيانات الشاملة هذه قائمة دقيقة من 11 فئة مقدمة ذاتيا ، مشروحة لقياس عدالة ومرونة الخوارزميات في نظام الذكاء الاصطناعي هذا" ، قالت Meta في مدونتها الرسمية المقتبسة يوم الجمعة ، 10 مارس.
وأضاف: "إن إصدار مجموعة البيانات هذه هو أحد النقاط الرئيسية لتقدمنا في مجال الحقوق المدنية ، والذي تم بالتشاور مع خبراء داخليين في هذا المجال".
تضمنت مجموعة بيانات Casual Conversation v2 26,467 مقطع فيديو مونولوج ، تم تسجيلها في سبعة بلدان ، وضمت 5,567 مشاركا مدفوعا ، إلى جانب بيانات الكلام والسمات المرئية والديموغرافية لقياس الفعالية المنهجية.
قال ميتا: "مع Casual Talks v2 ، أردنا استخدام مجموعات بيانات متعددة اللغات لدعم تطوير نماذج معالجة اللغة الطبيعية الشاملة".
بالإضافة إلى القائمة الموسعة للفئات ، يختلف Casual Conversation v2 عن الإصدار الأول من خلال تضمين مونولوجات المشاركين المسجلة خارج الولايات المتحدة. الدول السبع المدرجة في الإصدار 2 هي البرازيل والهند وإندونيسيا والمكسيك وفيتنام والفلبين والولايات المتحدة.
لذلك لا تأخذ البيانات معلومات Facebook أو تقدم صورا من Instagram ، فقد تم تصميم المحتوى المتضمن في مجموعة البيانات هذه لتحقيق أقصى قدر من الإدماج من خلال إعطاء الباحثين الذكاء الاصطناعي المزيد من عينات الأشخاص من خلفيات مختلفة لاستخدامها في نماذجهم.
"في المستقبل ، نأمل في توسيع مجموعة البيانات لتشمل مناطق جغرافية إضافية. هناك اختلاف آخر في أحدث مجموعة بيانات وهو أنه يتم منح المشاركين الفرصة للتحدث باللغتين الأساسية والثانية ، "قال ميتا.
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)