أصدرت شركة ميتا Meta أداة جديدة مفتوحة المصدر ومُعتمدة على الذكاء الاصطناعي تسمى AudioCraft ستساعد المستخدمين على إنشاء الموسيقى والأصوات بالاعتماد على الوصف النصي فقط.
وقالت ميتا إنّ أداة الذكاء الاصطناعي الجديدة تتضمن ثلاثة نماذج: AudioGen و EnCodec و MusicGen لتوليد الموسيقى والصوت وفك الترميز.
ويقوم النموذج MusicGen بأخذ المدخلات النصية وتحويلها إلى موسيقى، وقد تم تدريبه باستخدام 20,000 ساعة من الموسيقى مملوكة لشركة Meta أو تمّ ترخيصها خصيصًا لهذا الغرض.
فيما ينشئ النموذج AudioGen أصواتاً مثل نباح الكلاب أو خطى الأقدام أو غير ذلك من الأصوات، وقد تم تدريبها على المؤثرات الصوتية العامة.
أخيراً فإن النموذج يُتيح نسخة محسّنة من وحدة فك ترميز EnCodec.
وسمحت الشركة لوسائل الإعلام بالاستماع إلى بعض عينات الصوت المَصنوعة باستخدام AudioCraft.
بالمناسبة فإن شركة جوجل قد قدمت سابقاً أداة الذكاء الاصطناعي التجريبية الخاصة بها لتوليد الصوت والتي تسمى MusicLM.
ومع ذلك فإن ميتا تعتقد أن نموذجها الجديد يمكن أن يؤدي إلى موجة جديدة من الأغاني بنفس الطريقة التي غيّرت بها أجهزة المزج الموسيقى بمجرد أن أصبحت شائعة.
قالت الشركة في مدونة “نعتقد أن MusicGen يمكن أن يتحول إلى نوع جديد من الآلات، تمامًا مثل آلات المزج عندما ظهرت لأول مرة”.
أقر Meta بصعوبة إنشاء نماذج ذكاء اصطناعي قادرة على صنع الموسيقى لأن الصوت غالبًا ما يحتوي على ملايين النقاط حيث يقوم النموذج بعمل مقارنة بنماذج النص المكتوب مثل Llama 2 ، والتي تحتوي على الآلاف فقط.
وتقول الشركة إن AudioCraft بحاجة إلى مصادر مفتوحة من أجل تنويع البيانات المستخدمة لتدريبها.
من جهة أخرى فإن العديد من الفنانين قد عبروا عن مخاوفهم بشأن انتهاكات حقوق النشر، حيث تعمل برامج التعلم الآلي من خلال التعرف على الأنماط وتكرارها من البيانات المأخوذة من الويب.
لقد أطلقت شركات التسجيل والفنانين جرس الإنذار بالفعل بشأن مخاطر الذكاء الاصطناعي، حيث يخشى الكثير من نماذج الذكاء الاصطناعي أن تأخذ مواد محمية بحقوق الطبع والنشر للتدريب.