جوجل تطور MusicLM الذكاء الاصطناعي التي يمكن أن تنتج الأعمال الموسيقية في دقائق من النصوص المطالبة
جاكرتا - ابتكر باحثو Google الذكاء الاصطناعي يمكنه إنتاج بضع دقائق من الأعمال الموسيقية من موجه نصي. حتى الذكاء الاصطناعي يمكنها تغيير ألحان الصفير أو الهمهمة إلى أدوات أخرى.
هذا مشابه للطريقة التي تولد بها أنظمة مثل DALL-E صورا من موجه الكتابة. يطلق على النموذج اسم MusicLM ، وبينما لا يمكنك اللعب به بنفسك ، فقد قامت الشركة بتحميل الكثير من العينات المنتجة باستخدام النموذج.
MusicLM هو نموذج الموسيقى التوليدي من Google الذي يستخدم التعلم العميق لإنشاء موسيقى جديدة. تتضمن هذه العملية تدريب نموذج ببيانات الموسيقى الموجودة ، مثل الدرجات والأغاني والصوت ، لفهم الأنماط والمفاهيم في الموسيقى.
بعد ذلك ، يمكن للنموذج إنشاء موسيقى جديدة من خلال الجمع بين الأنماط والمفاهيم المأخوذة من بيانات التدريب. يقبل MusicLM مدخلات المستخدم مثل النوع والنوع والنغمات الرئيسية ، ويستخدم هذه المعلومات لإنشاء موسيقى جديدة وفقا لمواصفات المستخدم.
الأمثلة مثيرة للإعجاب. هناك مقتطفات مدتها 30 ثانية تبدو وكأنها أغان فعلية تتكون من أوصاف بطول فقرة تحدد أنواعا ومشاعر وحتى أدوات معينة ، بالإضافة إلى مقطوعات مدتها خمس دقائق ناتجة عن كلمة أو كلمتين مثل "تكنو لحني". "
كما تظهر على موقعهم التجريبي أمثلة على ما تنتجه العارضات عندما يطلب منهن إنتاج مقاطع مدتها 10 ثوان من الآلات مثل التشيلو أو الماراكاس ، ومقاطع مدتها ثماني ثوان من أنواع معينة ، وموسيقى مناسبة للهروب من السجن ، وحتى ما يبدو عليه عازف البيانو المبتدئ مقابل الكفاءة. ويشمل أيضا تفسيرات لعبارات مثل "النادي المستقبلي" و "معدن الموت الأكورديون".
يمكن ل MusicLM محاكاة الغناء البشري ، وبينما يبدو أنه يحصل على النغمة والصوت بشكل صحيح ، فهناك بالتأكيد جودة له. أفضل طريقة يمكن وصفها هي أن الصوت خشن أو ثابت.
الموسيقى التي تم إنشاؤها الذكاء الاصطناعي لها تاريخ طويل يعود إلى عدة عقود. هناك نظام ينسب إليه الفضل في صنع أغاني البوب ، وانتحال شخصية باخ أفضل من أي إنسان في 90s ، والعروض الحية المصاحبة.
يستخدم أحد الإصدارات الحديثة محرك توليد الصور الذكاء الاصطناعي في StableDiffusion لتحويل الأوامر النصية إلى مخططات طيفية يتم تحويلها بعد ذلك إلى موسيقى. وقالت الصحيفة إن MusicLM يمكن أن تتفوق على الأنظمة الأخرى من حيث "الجودة والالتزام بالنصوص" ، فضلا عن حقيقة أنها يمكن أن تتلقى ألحانا صوتية ونسخها.
ربما يكون هذا الجزء الأخير أحد أروع العروض التوضيحية التي وضعها الباحثون. يتيح لك هذا الموقع تشغيل الصوت المدخل، حيث يقوم شخص ما بطنين أو صفير أغنية، ثم يتيح لك سماع كيف يقوم النموذج بإعادة إنتاجها كقيادة توليفة إلكترونية، ورباعية وترية، وغيتار منفرد، وما إلى ذلك.
مثل المحاولات الأخرى في هذا النوع من الذكاء الاصطناعي ، كانت Google أكثر حرصا مع MusicLM من بعض أقرانها الذين لديهم تقنية مماثلة. "ليس لدينا خطط لإطلاق نموذج في هذه المرحلة" ، قالت الصحيفة ، نقلا عن The Verge. وهذا يخلق خطر "إساءة استخدام المحتوى الإبداعي المحتملة" أو الانتحال واحتمال الاستيلاء الثقافي أو التحريف.
هناك دائما فرصة لظهور التكنولوجيا في إحدى تجارب الموسيقى الممتعة من Google في مرحلة ما ، ولكن في الوقت الحالي ، الأشخاص الوحيدون الذين يمكنهم الاستفادة من هذا البحث هم أشخاص آخرون يبنون أنظمة الذكاء الاصطناعي الموسيقى.
تقول Google إنها أصدرت علنا مجموعة بيانات تحتوي على حوالي 5.500 زوج من النصوص الموسيقية ، والتي يمكن أن تكون مفيدة عند تدريب وتقييم أنظمة الذكاء الاصطناعي الموسيقية الأخرى.