أطلقت شركة جوجل نموذج Genie 3، وهو نموذج عالمي متعدد الأغراض يمتلك قدرة فائقة على توليد بيئات تفاعلية متنوعة ومعقدة. تتيح جوجل الآن لمشتركي خدمة AI Ultra في الولايات المتحدة الوصول إلى هذا الابتكار من خلال مشروع "جيني" (Project Genie)، مما يفتح آفاقاً جديدة في كيفية دمج الذكاء الاصطناعي مع الألعاب والوسائط التفاعلية.
- ✅ القدرة على توليد عوالم تفاعلية بالكامل بناءً على أوامر نصية أو صور بسيطة.
- ✅ متاح حالياً لمشتركي AI Ultra في الولايات المتحدة كنموذج بحثي تجريبي.
- ✅ يوفر تجربة بصرية واقعية بدقة 720p ومعدل إطارات يصل إلى 24 إطاراً في الثانية.
- ✅ يدعم ميزات متقدمة مثل "تخطيط العالم" (World Sketching) وإعادة المزج (Remixing).
يعمل نموذج العالم على محاكاة ديناميكيات البيئة، حيث يتنبأ بكيفية تطورها وكيفية تأثير الأفعال عليها. وبينما تمتلك Google DeepMind تاريخاً طويلاً في تطوير وكلاء لبيئات محددة مثل الشطرنج أو لعبة Go، فإن بناء ذكاء اصطناعي عام (AGI) يتطلب أنظمة قادرة على التنقل في تنوع العالم الحقيقي.
كيفية تصميم عالمك الخاص عبر Project Genie
يطلب منك هذا النموذج البحثي التجريبي وصف بيئتك ("كيف يبدو عالمك؟")، بما في ذلك الطريقة التي تريد استكشافه بها، سواء كان ذلك عن طريق المشي، الركوب، الطيران، أو القيادة، بالإضافة إلى اختيار منظور الشخص الأول أو الثالث. يمكنك تجربة ذلك عبر رابط مختبرات جوجل Project Genie.
بعد تحديد شخصيتك (سواء كانت إنساناً، حيواناً، جسماً، أو أي شيء آخر)، يقوم مشروع جيني بإنشاء معاينة للصورة، أو ما يسمى بـ "تخطيط العالم"، باستخدام تقنية Nano Banana Pro. يتيح لك ذلك معاينة الشكل الذي سيبدو عليه عالمك وتعديله بدقة قبل الانغماس فيه فعلياً.
عند الضغط على "إنشاء العالم"، يقتصر المستخدمون حالياً على جلسات مدتها 60 ثانية. تظهر العوالم بواقعية فوتوغرافية وبدقة 720p، مع معدلات تفاعل تتراوح بين 20 إلى 24 إطاراً في الثانية.
التفاعل اللحظي والفيزياء المتطورة
عندما تتحرك، يقوم Genie 3 (الذي تم استعراضه لأول مرة في أغسطس) بتوليد المسار أمامك في الوقت الفعلي بناءً على الإجراءات التي تتخذها. تحاكي جوجل الفيزياء والتفاعلات بـ "اتساق مذهل"، حيث يمكنك ضبط الكاميرا أثناء تفاعلك مع العالم، مع إمكانية تنزيل مقاطع فيديو لجولاتك الاستكشافية.
ميزة أخرى مثيرة هي "إعادة مزج العوالم" (Remix Worlds)، حيث تتيح لك إعادة تفسير العوالم الحالية من خلال البناء على مطالباتها النصية (Prompts). كما يمكنك استكشاف عوالم منسقة في المعرض أو استخدام أيقونة العشوائية للحصول على الإلهام.
القيود الحالية والتحديات التقنية
إلى جانب قيد الـ 60 ثانية، تحذر جوجل من بعض الجوانب التقنية التي لا تزال تحت التطوير:
- ✅ قد لا تبدو العوالم المولدة واقعية تماماً أو قد لا تلتزم دائماً بدقة بالمطالبات أو الصور أو فيزياء العالم الحقيقي.
- ✅ قد تكون الشخصيات أحياناً أقل قابلية للتحكم، أو قد تواجه تأخراً (Latency) في الاستجابة للأوامر.
تعمل جوجل بنشاط على تحسين المشروع من خلال إضافة "أحداث قابلة للتوجيه" تغير العالم أثناء استكشافه.
- وصف البيئة: محيط لا نهاية له من الأمواج الهائلة والرعدية، يتميز ببراميل فيروزية ضخمة تتكسر تحت وهج الشمس الدرامي، مع مئات النوارس التي تطير قريباً بما يكفي لحجب الرؤية مؤقتاً.
- وصف الشخصية: مقدمة لوح تزلج أبيض يشق المياه، موجه مباشرة نحو التجويف العميق لموجة ضخمة منكسرة.
مستقبل نماذج العالم والذكاء الاصطناعي العام
سيسمح هذا العرض التجريبي لجوجل بفهم أفضل لكيفية استخدام الناس لنماذج العالم في مجالات أبحاث الذكاء الاصطناعي والوسائط التوليدية. بدأ الإطلاق اليوم لمشتركي Google AI Ultra في الولايات المتحدة (فوق 18 عاماً)، مع خطط للتوسع في مناطق أخرى مستقبلاً.
بشكل أوسع، تعد نماذج العالم جزءاً من مهمة Google DeepMind للوصول إلى الذكاء الاصطناعي العام. إن محاكاة سيناريوهات العالم الحقيقي لها تطبيقات عملية تمتد من الروبوتات ونمذجة الرسوم المتحركة والخيال، إلى استكشاف المواقع والإعدادات التاريخية.
- وصف البيئة: عالم مفتوح على ارتفاعات عالية يتميز بتضاريس ثلجية قابلة للتشكيل.
- وصف الشخصية: متسلق جبال رشيق مع ميكانيكا حركة وقفز في جميع الاتجاهات.
ما هو الهدف الأساسي من مشروع جيني (Project Genie)؟
الهدف هو إنشاء نموذج عالمي قادر على تحويل الوصف النصي أو الصور إلى بيئات تفاعلية بالكامل، مما يساعد الباحثين والمبدعين على بناء عوالم افتراضية لمحاكاة الواقع أو الألعاب بطريقة غير مسبوقة.
من يمكنه الوصول إلى هذه الميزة حالياً؟
الميزة متاحة حالياً لمشتركي خدمة Google AI Ultra في الولايات المتحدة الذين تزيد أعمارهم عن 18 عاماً، وهي في مرحلة الإطلاق التدريجي.
هل العوالم الناتجة دائمة؟
حالياً، تقتصر الجلسات التفاعلية على 60 ثانية فقط، وهي مصممة للاستكشاف السريع والاختبار، ولكن يمكن للمستخدمين تحميل فيديوهات لجولاتهم داخل هذه العوالم.
ما هي دقة الصور والجرافيك في هذه العوالم؟
يتم توليد العوالم بدقة 720p، وهي توصف بأنها واقعية فوتوغرافياً، وتعمل بمعدل تحديث يتراوح بين 20 إلى 24 إطاراً في الثانية لضمان سلاسة الحركة أثناء التفاعل.
هل يمكنني تعديل العالم بعد إنشائه؟
نعم، من خلال ميزة "تخطيط العالم" (World Sketching)، يمكنك معاينة الصورة الأولية وتعديلها وضبط التفاصيل قبل البدء في عملية التوليد النهائي للعالم التفاعلي.
🔎 في الختام، يمثل مشروع "جيني" خطوة عملاقة نحو تمكين المستخدمين من ابتكار محتواهم الرقمي الخاص بضغطة زر، مما يعزز من مكانة جوجل كقائد في مجال الابتكار التقني، ويبشر بمستقبل حيث تصبح الحدود بين الخيال والواقع الافتراضي أكثر ذوباناً بفضل تقنيات الذكاء الاصطناعي المتطورة.
قم بالتعليق على الموضوع