تقنية
إطلاق نموذج Sora لتوليد الفيديوهات | بداية عصر جديد من المحتوى المرئي
أعلنت شركة OpenAI اليوم، ضمن سلسلة إطلاقاتها الممتدة على مدار 12 يومًا عن نموذج Sora لتوليد الفيديوهات، وذلك بعد تسريبه منذ أيام. وكان الإعلان الأول عنه في شهر فبراير الماضي، وقد أطلقت العديد من الشركات المنافسة أمثال جوجل وميتا نماذجها الخاصة لتوليد الفيديوهات منذ ذلك الحين، ولكن OpenAI فعلتها بطريقة مختلفة! لنرى كيف ذلك.
مميزات Sora
بدايةً، يمكن الوصول لنموذج Sora عبر الموقع الإلكتروني sora.com وهناك نرى الواجهة المميزة التي صممتها OpenAI، فعند فتح الموقع تظهر لك أحدث الفيديوهات التي صممها المستخدمون الآخرون بالإضافة لتبويب للفيديوهات المميزة، ويمكنك رؤية الأمر – Prompt المستخدم لإنشاء هذا الفيديو بالتحديد، تمامًا مثل DALL E نموذج توليد الصور من OpenAI قبل أن يدمج في شات جي بي تي.
من المميزات المبتكرة لدى Sora هي الـ Remix، تخيل أنك شاهدت فيديو في قائمة المميزة وأعجبك وأردت تعديله أو إضافة شيء ما عليه؛ كل ما عليك هو ضغط زر Remix وكتابة التغيير الذي تريد رؤيته وتحديد مدى شدة التغيير، هل هو خفيف أو متوسط أو تغيير كبير، وستحصل على فيديو جديد بالتعديلات التي ذكرتها، والنماذج التي يشاركها الناس مبهرة فعلًا.
لدينا ميزة جديدة وهي الـ StoryBoard، وهنا يمكنك إنشاء فيديو عن طريق دمج العديد من الفيديوهات الأخرى، وتظهر لك واجهة شبيه بمحرر الفيديو المعتاد، هذه الميزة مفيدة إذا أردت أن تنشئ فيديو يحتوي على العديد من اللقطات أو الأحداث المختلفة، كل ما عليك فعله هو كتابة كل حدث في “بطاقة” وترتيبها على الخط الزمني، و سيقوم Sora بالباقي، وسيوضح هذا الفيديو الأمر.
من الخيارات المتاحة في تعديل الفيديوهات هو Recut، لنقل أنك حصلت على فيديو جيد في بدايته ولكنه أصبح سيئًا في النهاية، يمكنك أن تختار Recut بعد إنشاء الفيديو، وتأخذ الجزء الذي تريد منه، سواء كان في بدايته أو نهايته أو من المنتصف، وتترك Sora يكمله أو تضيف بنفسك الأمر عن طريق ميزة Storyboard التي تحدثنا عنها، الجميل أن هذه الميزة تعمل على الفيديوهات التي صممها الآخرون.
هناك ميزة رائعة وهي Blend، وتعمل كالآتي، تجلب مشهدين مختلفين، ويدمجهم Sora معًا، يمكن أن يكون المشهد الأول فيديو من تصميمك باستخدام Sora والفيديو الآخر من تصويرك، أو أن يكون كلاهما مصمم بالذكاء الاصطناعي.
آخر المميزات -حتى الآن- هي الـ Loops، وفكرتها أن تجعل الفيديو يعيد نفسه إلى ما لانهاية، وذلك عبر اختيار مقطع من الفيديو لإعادته وسيعمل Sora على دمج البداية والنهاية ليكون الفيديو حلقة غير منتهية.
يمكنك توليد الفيديوهات بالذكاء الاصطناعي باستخدام نموذج Sora عن طريق أمر نصي Prompt أو أن ترفع صورة أو فيديو لديك وتركه لـ Sora لإكماله، بالمناسبة صور جوجل لديها ميزة مشابهة لتحريك صورك حركة بسيطة، وهي متاحة منذ مدة.
ميزة المجلدات وصلت لـ Sora قبل شات جي بي تي! من اسمها يمكنك إنشاء مجلدات لتجميع الفيديوهات التي تصممها لمشروع ما أكبر، فيديو تيك توك مثلًا، أو لتجميع فيديوهات ذات طابع معين في مكان واحد، آمل أن أراها في ChatGPT قريبًا.
بالنسبة للسلامة، فإن OpenAI متحفظة للغاية في هذا الشأن، حيث إن هناك الكثير من القيود على توليد الفيديوهات التي قد تتضمن صورًا لأشخاص، يرفض النموذج بتاتًا توليد فيديو به شخصية عامة أو علامة تجارية أو غير ذلك، بالتأكيد لمنع عمليات الاحتيال والنصب، التي تضاعفت بطريقة فجة مع تطور الذكاء الاصطناعي، وبالتأكيد إتاحة أداة كهذه لتوليد الفيديوهات لن يساعد في تقليل محاولات النصب تلك.
توافر Sora وقدراته
يستطيع Sora توليد فيديوهات بدقة 480p و 720p و 1080p، على أن الدقات الأعلى ستستغرق وقتًا أطول، الدقة الأدنى تستغرق ثواني معدودة و1080p تمتد لبضع دقائق، جميع الفيديوهات دون صوت وعليها علامة مائية صغيرة في أسفل الفيديو.
يمكنك أيضًا أن تختار مدة الفيديو وحجمه، وهناك اختيارات ثلاث، 16 في 9 وهي ابعاد فيديوهات اليوتيوب المعتادة، 1 في 1 (مربع)، وأخيرًا 9 في 16 (الأبعاد الطولية)، لتستطيع إنشاء فيديوهات تيك توك طولية أسرع من ذي قبل!
نموذج Sora لتوليد الفيديوهات متاح الآن لمشتركي شات جي بي تي بلس وبرو، الاشتراك ذا الـ200 دولار الذي أعلن عنه في أول يوم من سلسلة إطلاقات أوبن إيه آي. يحصل مشتركو بلس على 50 فيديو شهريًا بدقة 720p ومدة لا تزيد عن خمس ثوانٍ. أما مشتركو برو، فيتمتعون بالحصول على 500 فيديو سريع التوليد (Fast Generation) وعدد غير محدود من التوليدات الأبطأ بدقة 1080p ومدة تصل إلى 20 ثانية، إضافةً إلى خيار التحميل دون علامة مائية، التي لم تكن كبيرة على أي حال.
نموذج Sora متوفر الآن في الولايات المتحدة و”أغلب العالم” ولكن المملكة المتحدة وأغلب دول أوروبا لن يكون متاحًا فيهم، غالبًا بسبب المشاكل القانونية هناك.
للأسف لم يتحدثوا عن توفر Sora لمستخدمي الخطة المجانية، ولكن لا أظنه سيصل للعامة في أي وقت قريب، أعني، لديك فقط ثلاثة صور لتنشئها بـ ChatGPT في اليوم، فهل ستستطيع إنشاء فيديو حتى لو كان ثلاث ثوانٍ؟ لا أظن ذلك خصوصًا أن توليد الفيديوهات يستهلك الموارد بصورة عنيفة جدًا، للمقارنة، توليد صورة واحدة بالذكاء الاصطناعي يستهلك طاقة تعادل تلك التي تكفي لشحن هاتف ذكي!
Sora وعصر جديد من المحتوى على الإنترنت
أتوقع أن نرى المزيد من منشئي المحتوى على تيك توك تحديدًا يستفيدون من هذه الأداة؛ إذا فكرت في الأمر فإنها مناسبة تمامًا لهم، وسنرى المزيد من الفيديوهات عديمة المعنى، التي تمثل تلوث بصري أو Brainrot(تعفن الدماغ) كما يُسمى، وهي الكلمة الأنسب التي بالمناسبة اختارتها اكسفورد كلمة العام.
قامت OpenAI بعمل رائع في إطلاقها لنموذج Sora، هو ليس مجرد أداة تكتب فيها الأمر النصي وتحصل على فيديو وانتهى الأمر، بل sora.com الآن منصة كاملة لتصميم الفيديوهات، ورؤية ما صممه الآخرون، والمميزات الكثيرة التي أُضيفت ستجعل من عملية إنشاء فيديو كامل مدته دقيقة مثلًا بالذكاء الاصطناعي أمرًا سهلًا.
لا تزال OpenAI رائدة في مجال الذكاء الاصطناعي، وإطلاق Sora بهذا الشكل كبرنامج متكامل لإنشاء وتصميم الفيديوهات لم نشاهده من قبل قد مكّنَ هذا الفنان من إنشاء فيديو كامل مدته سبع دقائق وإضافة الصوت عليه من عنده، ولا أظن أن أيًا منا سيقدر على تحديد أنه مصمم بالذكاء الاصطناعي من الوهلة الأولى! وليس وحده، بل هناك الكثير من الفيديوهات المنشورة على منصة إكس.
تبرز فائدة الفيديوهات المصممة بالذكاء الاصطناعي في مجال الـ Stock footage، حيث إنه يمكنك بسهولة إنشاء مقطع قصير مدته ثوانٍ معدودة لهدف معين وعلى أي حال لن تحتاج فيه إلى الصوت، أما بالنسبة للفيديوهات الواقعية، فحسب التجارب فإن الذكاء الاصطناعي ما زال يعاني فيها، ومع الحركات عمومًا، لا تبدو حركات الحيوانات مثلًا طبيعية أو حتى منطقية.
على أي حال، OpenAI لديها المزيد! ما زال هناك تسعة أيام متبقية ضمن سلسلة إطلاقات Ship-mas، يتوقع أن نرى تحديثات لنموذج DALLE-E وآمل أن تكون متقدمة مثل sora، وكذلك دعم الرؤية على نموذج GPT 4o المنتظر منذ شهر مايو، تابعونا على منصات عرب هاردوير للتغطية الكاملة!
<!—->