تعلن شركة OpenAI عن Sora، وهو نموذج فيديو نصي مبتكر يعتمد على الذكاء الاصطناعي. شاهده على أرض الواقع.
أولاً النص، ثم الصور، الآن OpenAI يحتوي على قالب لإنشاء مقاطع الفيديو.
يوم الخميس المبدعين ChatGPT وأعلن DALL-E سورا، نموذج تسليم نص فيديو. بدءًا من اليوم، أصبح Sora متاحًا للفرق الحمراء أو الخبراء الذين يختبرون النموذج بشكل عدائي بحثًا عن الأضرار والمخاطر. ووفقًا للإعلان، فهو متاح أيضًا لمجموعة مختارة من الفنانين التشكيليين والمصممين وصانعي الأفلام “للحصول على تعليقات حول كيفية تطوير النموذج بحيث يكون مفيدًا للغاية للمحترفين المبدعين”.
تعمل OpenAI على تطوير أدوات الذكاء الاصطناعي الإنتاجية بوتيرة مذهلة منذ إطلاق ChatGPT في نوفمبر 2022. ومنذ ذلك الحين، شهدنا إصدار GPT-4، والمطالبات الصوتية والصورة، ونموذج الصور DALL-E 3 الجديد، وكلها متاحة عبر ChatGPT. كان لواجهة برمجة تطبيقات OpenAI أيضًا تأثير هائل على صناعة الذكاء الاصطناعي، حيث مكن الشركات والمطورين من إنشاء أدوات الذكاء الاصطناعي التوليدية الخاصة بهم. واليوم، تتخذ OpenAI الخطوة الرئيسية التالية نحو تطوير قدرات الذكاء الاصطناعي من خلال إنشاء الفيديو.
هناك نماذج أخرى لتوليد الفيديو، لكن لا أحد منها قادر على إنتاج مقاطع فيديو واقعية ومعقدة مثل تلك التي من المفترض أن ينشئها سورا. ميتا لديها أداة لعمل مقاطع فيديو قصيرة، و جوجل تعمل الشركة على نموذج فيديو نصي خاص بها، ولكنها لا تزال في مرحلة البحث.
باستخدام Sora، يمكن للمستخدمين إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة، وتتضمن مشاهد تفصيلية وشخصيات متعددة. يتضمن الإعلان مقاطع من مقطع فيديو يتبع سيارة دفع رباعي على طول طريق جبلي متعرج ولقطات “تاريخية” لكاليفورنيا خلال عصر حمى البحث عن الذهب.
الآن دعنا ننتقل إلى التفاصيل الأمنية الدقيقة. بالإضافة إلى الفريق الأحمر للنموذج، تقول OpenAI إن أدوات الإنشاء الخاصة بها تسمح بتصنيف مقاطع الفيديو التي أنشأها Sora على هذا النحو، وفقًا لإرشادات C2PA. ويستخدم أيضا الأساليب الأمنية الحالية يتم تطبيقه على DALL-E الذي يرفض المطالبات النصية غير الملائمة أو الضارة.
وأخيرا، تقول OpenAI إنها “ستعمل على إشراك صناع السياسات والمعلمين والفنانين في جميع أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة”. تعتقد الشركة أن أفضل طريقة لتعلم جميع الطرق المفيدة والضارة التي سيستخدمها الأشخاص لـ Sora هي “التعلم من الاستخدام الواقعي الذي يعد جزءًا أساسيًا من إنشاء وإطلاق المزيد من أنظمة الذكاء الاصطناعي بشكل أكثر أمانًا بمرور الوقت.