أعلنت شركة OpenAI عن إطلاق نسخة الجيل الثاني من نموذجها الرائد في توليد الوسائط، وهو Sora 2، الذي يعد بثورة حقيقية في عالم إنشاء الفيديو والصوت بالاعتماد على الذكاء الاصطناعي. يأتي هذا الإعلان بالتوازي مع إطلاق تطبيق تواصل اجتماعي مخصص لنظام iOS، ويحمل الإصدار الجديد تحسينات جذرية تتجاوز قدرات سابقه، خاصة في مجالات الدقة المادية، والاتساق البصري المتكامل، وإضافة التزامن الصوتي المعقد. يهدف Sora 2 إلى إنتاج مقاطع مرئية قصيرة ذات واقعية فائقة، تشمل حركات طبيعية ومشاهد صوتية متناغمة مع الحوارات المولدة.

- ✅ يمثل Sora 2 قفزة نوعية تماثل تأثير GPT-3.5 في مجال معالجة اللغات الطبيعية.
- ✅ يركز النموذج الجديد على محاكاة دقيقة لقوانين الفيزياء وتصحيح الأخطاء الفيزيائية التي كانت تظهر في الإصدارات السابقة.
- ✅ تم تدريب النموذج على كم هائل من بيانات الفيديو لتحقيق اتساق أكبر في سلوك الكائنات وثبات حالة العالم.
- ✅ يقدم دعماً متقدماً لتوليد الصوت المحيط والحوار المتزامن لتعزيز الترابط السمعي البصري.
يُعد التحسن في الالتزام بقوانين الفيزياء هو السمة الأبرز في Sora 2. فعلى عكس النماذج السابقة التي قد تُظهر تشوهات غير منطقية للحفاظ على التناسق النصي، يستطيع Sora 2 الآن محاكاة السلوكيات الفيزيائية بدقة ملحوظة، مثل ارتداد الكرات بطريقة طبيعية أو إظهار اختلال التوازن بشكل واقعي أثناء الحركة المعقدة. وقد أُنجز هذا المستوى من المحاكاة عبر تدريب مكثف باستخدام مجموعات بيانات فيديو ضخمة، وهي عملية لا تزال في مراحلها الأولى مقارنةً بتطوير نماذج اللغة الكبيرة.
من الناحية البصرية، يُظهر النموذج اتساقًا عاليًا في ثبات الكائنات، وثبات حالة العالم المحيط، مع قدرة فائقة على الحفاظ على التسلسل المنطقي للأحداث عبر زوايا كاميرا مختلفة. كما يتيح Sora 2 للمستخدمين دمج عناصر واقعية مُسجلة مسبقًا، مثل ظهور أشخاص أو حيوانات أو أشياء معينة ضمن المشهد المولّد، وذلك بعد عملية تحقق صارمة تشمل تسجيل الفيديو والصوت لضمان الهوية ومنع إساءة الاستخدام.
التكامل السمعي البصري وتطبيقات الواقع المعزز
لا يقتصر تطور Sora 2 على الجانب المرئي فحسب، بل يمتد ليشمل التكامل الصوتي الاحترافي. يدمج النموذج الآن المؤثرات الصوتية المحيطة، والمؤثرات الخاصة، وحتى الأصوات البشرية المتزامنة تمامًا مع الأحداث المرئية، مما يرفع من جودة المشاهد إلى مستوى ترابط سمعي بصري غير مسبوق. يدعم هذا النموذج مجموعة واسعة من الأنماط البصرية، بدءًا من الرسوم المتحركة السينمائية وحتى الأسلوب الياباني التقليدي، مع توفير تحكم دقيق في البيئة، وتحديد مدة المشهد، وإدارة الانتقالات السلسة بين اللقطات.
إلى جانب النموذج الأساسي، كشفت OpenAI عن إطلاق تطبيق جديد لنظام iOS، يحمل اسم Sora أيضًا، يسمح بإنشاء مقاطع فيديو تصل مدتها إلى عشر ثوانٍ بناءً على مدخلات نصية بسيطة أو صور ثابتة، مع قيود تمنع توليد وجوه بشرية غير مصرح بها. كما أُضيفت ميزة "cameo" التي تتيح للمستخدم إدراج صورته الشخصية أو صور أصدقائه في المقاطع المولدة، شريطة الحصول على موافقة صريحة منهم لتعزيز جوانب الأمان والخصوصية.
على عكس المنصات الأخرى التي تركز على إبقاء المستخدمين لأطول فترة ممكنة، تؤكد OpenAI أن هدف Sora هو تحفيز الإبداع. يتميز نظام التوصيات داخل التطبيق باستخدام نماذج لغوية متقدمة تتيح تخصيص المحتوى استنادًا إلى اللغة الطبيعية للمستخدم، حيث تُفضل الخوارزميات عرض مقاطع الفيديو التي أنشأها الأشخاص الذين يتفاعل معهم المستخدم بشكل طبيعي، بدلاً من الترويج للمحتوى الشائع بشكل عشوائي.
لتعزيز سلامة المنصة، خاصة بين الفئات العمرية الأصغر، تم وضع قيود صارمة على المراهقين تشمل تحديد عدد مقاطع الفيديو التي يمكن مشاهدتها يوميًا، ووضع قيود إضافية على استخدام مقاطع الفيديو القصيرة. كما طورت OpenAI أدوات رقابة أبوية متاحة عبر ChatGPT، تمنح المستخدمين القدرة على تخصيص صفحاتهم، والتحكم في من يمكنه إرسال رسائل مباشرة لهم، وإلغاء خاصية التشغيل المتواصل للمحتوى.
ما هي أبرز الميزات الجديدة التي يقدمها نموذج Sora 2 مقارنةً بالإصدار الأول؟
التركيز الأساسي لـ Sora 2 هو التحسين الكبير في الدقة المادية والاتساق البصري، والقدرة على محاكاة التفاعلات الفيزيائية المعقدة، بالإضافة إلى دمج الصوت المحيط والحوار المتزامن بشكل أكثر واقعية.
كيف تتعامل OpenAI مع مسألة الواقعية المفرطة وإساءة الاستخدام المحتملة؟
تعتمد الشركة على آليات أمان صارمة تتطلب التحقق من الهوية عبر الفيديو والصوت قبل السماح بإضافة عناصر واقعية مسجلة مسبقًا، كما وضعت قيودًا على المحتوى المولّد للفئات العمرية الأصغر.
هل يتوفر تطبيق Sora الجديد على منصات تشغيل أخرى غير نظام iOS؟
في الوقت الحالي، تم إطلاق التطبيق الجديد الذي يتيح إنشاء مقاطع قصيرة بناءً على المدخلات النصية بشكل أساسي لنظام iOS، مع التركيز على توفير ميزات التحكم الأبوي والخصوصية.
ما هو الهدف الأساسي الذي تسعى إليه OpenAI من خلال منصة Sora الجديدة؟
تؤكد OpenAI أن الهدف الأساسي هو تشجيع الإبداع والإنتاجية وليس زيادة وقت استهلاك المحتوى، حيث تركز خوارزميات التوصية على ربط المستخدمين بالمحتوى الذي ينشئه المحيطون بهم.
🔎 في الختام، يُجسد إطلاق Sora 2 تحولاً جوهريًا في إمكانيات توليد الوسائط المرئية بالذكاء الاصطناعي، حيث لم تعد المسألة تتعلق فقط بإنشاء صور متحركة، بل ببناء عوالم متماسكة تحترم قوانين الفيزياء وتتفاعل صوتيًا وبصريًا بواقعية مذهلة. هذا التطور يضع معايير جديدة للمحترفين والمبدعين على حدٍ سواء، ويفتح آفاقاً غير محدودة للإنتاج السينمائي، والتعليم، والتواصل الرقمي المستقبلي، شريطة استمرار التركيز على ضوابط الأمان والشفافية في استخدام هذه التقنية القوية.
قم بالتعليق على الموضوع