مولد فيديو مفتوح المصدر يعتمد على تقنية جديدة (Infinity Star)

  (Infinity Star): ByteDance تطلق مولد فيديو مفتوح المصدر يعتمد على تقنية جديدة





في خطوة مفاجئة لمجتمع الذكاء الاصطناعي، أعلنت شركة ByteDance (عملاق التكنولوجيا الصيني) عن إطلاق نموذج جديد لتوليد الفيديو مفتوح المصدر يحمل اسم Infinity Star. يمثل هذا الموديل إضافة هامة إلى أدوات صناعة الفيديو، لا سيما بفضل اعتماده على منهجية مختلفة عن النماذج الرائدة الحالية.


Infinity Star: تقنية AutoRegressive لتوليد الفيديوهات


على عكس معظم مولدات الفيديو القوية التي ظهرت مؤخراً مثل Wan و Hunyuan، والتي تعتمد على موديلات "Diffusion Transformer"، فإن موديل Infinity Star يعتمد على طريقة "الانحدار الذاتي" (AutoRegressive) في توليد المحتوى.


ما هي ميزة تقنية الانحدار الذاتي؟


تعمل نماذج الانحدار الذاتي (على غرار بعض نماذج GPT في توليد الصور) على توليد المحتوى بشكل متسلسل ومباشر، وهذا يمنحها ميزة تنافسية كبيرة في جانب واحد: السرعة.


يُقال إن Infinity Star يمتلك قدرة على توليد مقاطع فيديو بدقة 720p ومدتها 5 ثوانٍ أسرع بحوالي 10 مرات من الطرق التقليدية الأخرى. هذه السرعة تجعلها خياراً جذاباً للمطورين الذين يبحثون عن حلول سريعة للتجربة والإنتاج الأولي.


الجودة في الوقت الحالي: تحديات وتناقضات


على الرغم من السرعة الفائقة، فإن النتائج الحالية التي يقدمها موديل Infinity Star ما زالت تواجه تحديات ملحوظة مقارنة بالمنافسين الأقوياء.


ملاحظات على الأمثلة المُولّدة:


الدقة والتفاصيل: الجودة الحالية للفيديوهات المنشأة بدقة منخفضة نسبياً (حوالي 480p)، وحتى عند استخدام الدقة الأعلى، تظهر مشكلات في التفاصيل الصغيرة.


التناسق البصري: هناك تشويش كبير وعدم دقة في ملامح الوجوه والأصابع والتفاصيل الدقيقة. كما أن الخلفيات قد "تتلوي" أو تفقد تناسقها مع مرور الوقت في المقطع، مما يدل على ضعف في ميزة التناسق الزمني (Temporal Consistency).


في المقارنات الرسمية، يتفوق Infinity Star على نماذج الانحدار الذاتي الأخرى في الأداء، مما يجعله حالياً أفضل موديل من فئة الانحدار الذاتي. ومع ذلك، عند مقارنته بنماذج Diffusion Transformer الرائدة مثل Wan 2.1، تظل نماذج الانتشار هي الأفضل في الجودة الإجمالية ومتوسط الأداء.


إتاحة الكود والموديل: فرصة للمطورين


أحد أهم الأخبار المتعلقة بـ Infinity Star هو قرار ByteDance بإطلاق الكود بالكامل ونماذج التدريب للجمهور.


يمكن للمطورين والباحثين الوصول إلى صفحة المشروع الرئيسية للحصول على التعليمات اللازمة لتنزيل وتشغيل الموديل محلياً.


متطلبات تشغيل الموديل


يتكون موديل Infinity Star من 8 مليار بارامتر، وتبلغ نسخة الـ 720p منه حجماً ضخماً يصل إلى 35 جيجابايت.


تجدر الإشارة إلى أن نماذج الانحدار الذاتي معروفة بكونها أكبر في الحجم من موديلات Diffusion Transformer المماثلة. هذا يعني أن تشغيل Infinity Star يتطلب بطاقة شاشة متقدمة وخارقة (High-End GPU) ولن يكون متاحاً بسهولة على الأجهزة المنزلية العادية.


تقييم نهائي


بينما يمثل Infinity Star إنجازاً تقنياً كونه موديل رائد في فئة الانحدار الذاتي، خاصة من حيث السرعة، فإن الجودة البصرية الحالية ومتطلبات التشغيل العالية تجعله أقل جاذبية للمستخدم العادي في الوقت الراهن.


لكن بالنسبة للباحثين والمطورين الذين يرغبون في استكشاف تكنولوجيا الانحدار الذاتي أو القيام بعمليات Fine-Tuning، فإن إطلاق الموديل والكود بشكل مفتوح المصدر يمثل فرصة لا تعوض.


الروابط والمعلومات المتعلقة بالأداة متاحة في الوصف.


هاشتاجات الموضوع:

code

Code

download

content_copy

expand_less

#InfinityStar #ByteDance #مولد_فيديو_مفتوح_المصدر #الذكاء_الاصطناعي #AutoRegressive #توليد_الفيديو_بالذكاء_الاصطناعي #DiffusionTransformer #تكنولوجيا #AI_Tools #صناعة_المحتوى

إرسال تعليق

0 تعليقات