"ميتا" تطلق مشروع إنشاء البودكاست بالذكاء الاصطناعي
أعلنت شركة ميتا عن إطلاق مشروع جديد يحمل اسم "NotebookLlama"، وهو نسخة مفتوحة المصدر لنظام إنشاء الحلقات الصوتية التفاعلية "البودكاست" باستخدام الذكاء الاصطناعي، لتدخل بذلك في منافسة مباشرة مع منصة "غوغل" المماثلة NotebookLM، التي اكتسبت شهرة واسعة مؤخرًا.
يعتمد مشروع "NotebookLlama" على نماذج الذكاء الاصطناعي الخاصة بشركة ميتا، والمعروفة باسم "Llama"، للقيام بجزء كبير من عمليات المعالجة. وكما هو الحال في NotebookLM، يمكن لأداة "NotebookLlama" توليد ملخصات صوتية بأسلوب حواري يشبه حلقات البودكاست، بالاعتماد على الملفات النصية التي يتم رفعها إليها.
تبدأ الأداة بتحويل النصوص إلى ملفات صوتية، مثل المقالات الإخبارية أو المنشورات، ثم تضيف "لمسات درامية" وتفاعلات تجعل النصوص أكثر حيوية وتفاعلية قبل إرسالها إلى نماذج مفتوحة لتحويل النص إلى كلام.
على الرغم من أن النتائج الحالية لأداة "NotebookLlama" لا ترقى إلى مستوى الجودة الصوتية التي تقدمها أداة NotebookLM من "غوغل"، حيث تبدو الأصوات الناتجة من "NotebookLlama" آلية وغير طبيعية إلى حد ما، مع تداخل غير متناسق في الحديث، إلا أن باحثي ميتا أشاروا إلى إمكانية تحسين الجودة باستخدام نماذج أكثر قوة.
وأفاد الباحثون بأن "نموذج تحويل النص إلى كلام هو العامل الأساسي في مدى طبيعية الصوت"، موضحين أن هناك إمكانية لاستخدام نهج آخر لتوليد الحلقات الصوتية عبر جعل اثنين من وكلاء الذكاء الاصطناعي يتناقشان حول الموضوع ويصيغان الحوار، بدلاً من الاعتماد على نموذج واحد لكتابة المخطط.
جدير بالذكر أن "NotebookLlama" ليست المحاولة الأولى لاستنساخ ميزة البودكاست من أداة غوغل NotebookLM، فقد ظهرت مشاريع عدة تسعى لتحقيق هذا الهدف، لكنها لم تتمكن بعد من التغلب على مشكلة "الهلوسة" التي تعاني منها العديد من تطبيقات الذكاء الاصطناعي، بما في ذلك أداة NotebookLM نفسها، حيث قد تولّد معلومات غير دقيقة أو مختلَقة أثناء الحلقات الصوتية.