أعلنت Meta عن إطار عمل audio2photoreal الذكاء الاصطناعي ، والذي يمكنه إنشاء مشاهد حوار الشخصيات عن طريق إدخال ملفات الدبلجة

أعلنت Bit News Meta مؤخرا عن إطار عمل الذكاء الاصطناعي يسمى audio2photoreal ، وهو قادر على إنشاء سلسلة من نماذج شخصيات NPC الواقعية و "مزامنة الشفاه" تلقائيا و "وضع" نماذج الشخصيات بمساعدة ملفات التعليق الصوتي الموجودة.

أشار تقرير البحث الرسمي إلى أنه بعد استلام ملف الدبلجة ، سيقوم إطار عمل Audio2 photoreal أولا بإنشاء سلسلة من نماذج NPC ، ثم استخدام تقنية التكميم وخوارزمية الانتشار لإنشاء إجراءات النموذج ، حيث توفر تقنية التكميم مرجع عينة العمل للإطار ويتم استخدام خوارزمية الانتشار لتحسين تأثير إجراءات الشخصية الناتجة عن الإطار.

كان ثلاثة وأربعون بالمائة من المقيمين في التجربة الخاضعة للرقابة "راضين بشدة" عن مشاهد حوار الشخصيات الناتجة عن الإطار ، لذلك شعر الباحثون أن إطار Audio2 photoreal كان قادرا على توليد حركات "أكثر ديناميكية وتعبيرا" من المنتجات المنافسة في الصناعة. يذكر أن فريق البحث قد جعل الآن الكود ومجموعة البيانات ذات الصلة عامة على GitHub.

AUDIO-1.99%

شاهد النسخة الأصلية

المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.

تسجيلات الإعجاب 1

أعجبني
1
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
#BTC#
194k المنشورات
#ETH#
121k المنشورات
#PI#
104k المنشورات
4#GateioInto11#
77k المنشورات
5#ContentStar#
64k المنشورات
6#BOME#
60k المنشورات
7#GT#
57k المنشورات
8#DOGE#
53k المنشورات
9#MAGA#
52k المنشورات
10#SLERF#
51k المنشورات

تثبيت

خريطة الموقع