كشفت شركة جوجل النقاب عن عائلة نماذجها الجديدة والمبتكرة Gemini Omni، وهي نماذج توليدية صُممت تحت شعار "إنشاء أي شيء". يتيح هذا النموذج المتطور للمستخدمين اليوم القدرة على إنتاج مقاطع فيديو تتسم بواقعية مذهلة، مما يفتح آفاقاً جديدة في عالم صناعة المحتوى الرقمي المعتمد على الذكاء الاصطناعي.
ملخص المقال في نقاط سريعة
- ✅ إطلاق Gemini Omni لإنشاء فيديوهات واقعية من مدخلات متعددة.
- ✅ النموذج يعتمد على فهم عميق للفيزياء والواقع لإنتاج محتوى متماسك.
- ✅ توفر نسخة Gemini Omni Flash للمشتركين وإتاحة النسخة المجانية قريباً عبر YouTube.
- ✅ دمج تقنيات SynthID لضمان الأمان وتحديد المحتوى المنتج بواسطة الذكاء الاصطناعي.
تطور "نموذج العالم" والقدرات المتعددة لنموذج Omni
لطالما سعت جوجل في السنوات الأخيرة إلى تطوير ما يسمى بـ "نموذج العالم" (World Model)، وهو نظام قادر على الحفاظ على عالم متماسك وواقعي في المحتوى المولد. بدأت هذه الرحلة بنموذج Genie الذي أنشأ تجارب تفاعلية تشبه ألعاب الفيديو، وتطورت عبر نماذج Veo وNano Banana التي قدمت حلولاً لإنشاء وتحرير الفيديو والصور عبر النصوص.
خلال مؤتمر I/O 2026، كشفت الشركة عن Gemini Omni، وهو نموذج يستفيد من فهم متعدد الوسائط (Multimodal) متجذر في الواقع. ورغم أن Omni يركز حالياً على إنتاج الفيديو، إلا أنه مصمم ليكون قادراً على "إنشاء أي شيء من أي مدخلات". وهذا يعني دمج النصوص، الصور، الفيديو، والصوت (المقتصر حالياً على عينات الكلام) لإنتاج فيديو نهائي موحد، مع القدرة على تحسين الفيديو وتعديله في خطوات لاحقة.
عروض توضيحية مذهلة: فيزياء واقعية وتفاصيل دقيقة
جاءت العروض الأولية التي قدمتها جوجل لنموذج Omni مبهرة للغاية، حيث أظهرت كيف يفهم Gemini كل عنصر في الفيديو النهائي. ويعد فيديو "الرخام المتدحرج" مثالاً ممتازاً، حيث أظهر فيزياء تصديقية لحركة الكرة وتأثيرات صوتية مقنعة لكل ارتداد ورنة جرس.
كما تضمن عرض آخر مقطع فيديو بأسلوب "الصلصال المتحرك" (Claymation) يشرح عملية طي البروتين بطريقة تعليمية وجذابة.
التوفر والوصول: من المحترفين إلى منشئي المحتوى على YouTube
على عكس نموذج Genie الذي ظل مقتصرًا على مشتركي AI Ultra، تسعى جوجل لجعل سلسلة Gemini Omni متاحة على نطاق واسع. النموذج الأول في السلسلة، Gemini Omni Flash، متاح الآن لجميع المشتركين في باقات AI Plus وما فوقها. أما بالنسبة لمن يرغبون في مشاركة إبداعاتهم مع العالم، فسيكون Gemini Omni متاحاً مجاناً عبر YouTube Shorts وتطبيق YouTube Create في وقت لاحق من هذا الأسبوع. كما تم التلميح إلى نموذج أكثر تقدماً باسم "Omni Pro" ستكشف تفاصيله قريباً.
نظراً للواقعية الكبيرة التي يقدمها النموذج، تتخذ الشركة تدابير صارمة لضمان إنتاج الفيديوهات بمسؤولية. واقتباساً من تطبيق Sora الذي طورته OpenAI، سيتيح Gemini Omni إنشاء "أفاتار" (Avatar) خاص بك ليظهر في الفيديوهات التي تنشئها. وبخلاف ذلك، لن يتمكن Omni في البداية من تعديل الأصوات والكلام في الفيديوهات حتى تضمن جوجل تقديم هذه الميزة بشكل مسؤول. وكإجراء أمني إضافي، سيتم وضع علامة مائية رقمية باستخدام تقنية SynthID على جميع الفيديوهات لتمييزها كمحتوى مولد بالذكاء الاصطناعي.
ما الذي يميز Gemini Omni عن نماذج الفيديو السابقة؟
يتميز Gemini Omni بقدرته على فهم "الواقع الفيزيائي"، حيث لا يقوم فقط بإنشاء صور متحركة، بل يدرك كيف تتفاعل الأجسام مع بعضها البعض (مثل ارتداد الكرة) وكيف يصدر الصوت المتزامن مع هذه الحركات، مما يجعله نموذجاً متكاملاً لإنشاء المحتوى من الصفر.
هل يمكنني استخدام Gemini Omni مجاناً؟
نعم، تخطط جوجل لإتاحة النموذج لجمهور واسع. بينما يتوفر إصدار Omni Flash حالياً للمشتركين في الخطط المدفوعة، سيتمكن مستخدمو YouTube Shorts من الوصول إليه مجاناً لاستخدامه في إنشاء مقاطع فيديو قصيرة ومبدعة.
كيف تضمن جوجل عدم استخدام هذه التقنية في التزييف العميق؟
تطبق جوجل بروتوكولات أمان صارمة، تشمل تقنية SynthID لوضع علامات مائية غير مرئية توضح أن الفيديو نتاج ذكاء اصطناعي، بالإضافة إلى تقييد القدرة على تعديل الكلام والأصوات البشرية في المراحل الأولى للإطلاق لضمان الاستخدام المسؤول.
ما هي أنواع المدخلات التي يقبلها النموذج؟
يدعم النموذج حالياً دمج النصوص والصور والفيديوهات وحتى عينات الكلام لإنتاج فيديو نهائي. الهدف النهائي لشركة جوجل هو جعل Omni قادراً على معالجة أي نوع من البيانات لإنتاج أي نوع من المحتوى الإبداعي.
🔎 في الختام، يمثل إطلاق Gemini Omni خطوة عملاقة نحو دمج الذكاء الاصطناعي في صميم العملية الإبداعية، حيث لم يعد الأمر مقتصرًا على تحويل النص إلى فيديو فحسب، بل أصبح يتعلق بفهم العالم ومحاكاته بدقة مذهلة. ومع توفر هذه الأدوات لجمهور عريض عبر منصات مثل YouTube، فإننا على أعتاب ثورة في كيفية إنتاج واستهلاك المحتوى المرئي، مع الالتزام الكامل بمعايير الأمان والشفافية التي تضمن تمييز الإبداع البشري عن المحتوى المولد آلياً.
قم بالتعليق على الموضوع