هلا نيوز – وكالات
قدمت مجموعة “ميتا” أمس الجمعة واجهة الذكاء الاصطناعي التوليدي الجديدة “موفي جن” (Movie Gen)، التي تتيح إنشاء مقاطع فيديو صوتية استنادًا إلى نصوص أو صور، مما يعكس التقدم الكبير في خدمات الذكاء الاصطناعي.
تعتبر “موفي جن” النموذج الثالث الذي تطلقه “ميتا” في مجال توليد الصور، بعد نموذجين سابقين أُطلقا في يوليو 2022 ونوفمبر 2023. ومع ذلك، لم تُتاح أي من هذه الواجهات للجمهور بعد، حيث لا تزال في مرحلة الاختبار من قبل صانعي المحتوى والمخرجين الذين يقيمون “موفي جن” ويساهمون في تحسين البرنامج. ولم تكشف “ميتا” عن موعد طرحه للجمهور.
إضافة إلى مقاطع الفيديو التوضيحية، قدمت المجموعة وثيقة بحثية توضح تفاصيل النموذج الجديد. ويعتمد هذا النموذج على نماذج اللغة، التي تستند إلى قواعد بيانات ضخمة، مما يمكّنها من إنشاء محتوى متنوع يشمل نصوص وصور وفيديوهات وصوتيات استجابةً لطلبات مكتوبة بلغة بسيطة.
تتيح “موفي جن” إمكانية إنتاج مقاطع فيديو بناءً على نص مكتوب أو صورة، كما توفر أدوات لتحرير مقاطع الفيديو الموجودة. ويستطيع النموذج أيضًا إضافة مقاطع صوتية وفقًا لنفس المبدأ القائم على طلبات اللغة اليومية.
وفي فيديو قصير نُشر على موقع “ميتا”، يُظهر كيف يمكن تعديل الفيديو عبر إضافة مشاهد لسيارة رباعية الدفع في الصحراء مع صوت محرك هادر ونغمة غيتار بمجرد التلفظ بجملة واحدة.
وأشارت “ميتا” إلى أن “موفي جن” قد تصبح متاحة للاستخدام في المستقبل عبر منصات إنستغرام وفيسبوك، أو حتى من خلال تطبيق واتساب.
وتجدر الإشارة إلى أن “ميتا” ليست الوحيدة في هذا المجال، حيث تقدم شركة “رانواي إيه آي” نموذجًا مماثلاً يتيح إنشاء مقاطع فيديو قصيرة بناءً على طلبات مكتوبة، بينما أطلقت “أوبن إيه آي” نموذج “سورا” وتعمل غوغل على نموذج يُسمّى “لوميير”.
ووفقًا لبيانات “ميتا”، فإن “موفي جن” يتفوق على النماذج المماثلة عند تقييم جودة إنتاجها من قبل البشر.