وصف المدون

مبتكر مبسط

إعلان الرئيسية

أعلنت شركة جوجل عن إطلاق نموذجها المتطور لتوليد الصور وتحريرها، والذي يحمل اسم Gemini 3 Pro Image، والمعروف أيضًا بـ "Nano Banana Pro". يمثل هذا النموذج قفزة نوعية ضمن منظومة الذكاء الاصطناعي Gemini، حيث يدمج ببراعة بين القدرات التصميمية البصرية والاستدلال المنطقي والمعرفة المستندة إلى بيانات واقعية، مما يعد بتحول كبير في كيفية إنشاء المحتوى المرئي.

  • ✅ يتميز نموذج Nano Banana Pro بدقة تخصيص غير مسبوقة، وهو متاح الآن عالميًا عبر خيار "Create image" في تطبيق Gemini.
  • ✅ يعتمد النموذج على آلية "الارتكاز على البحث" (Search grounding) لضمان استناد النتائج البصرية إلى بيانات جوجل الحية والآنية.
  • ✅ قدرة فائقة على إنتاج نصوص طويلة ودقيقة داخل الصور، ودعم متعدد اللغات وتحرير مرئي بجودة سينمائية تصل إلى دقة 4K.
  • ✅ دمج تقنية SynthID لضمان الشفافية عبر علامات مائية رقمية غير مرئية على جميع الصور المولدة.
إطلاق جوجل لنموذج Nano Banana Pro للذكاء الاصطناعي
صورة أنشأتها "البوابة التقنية" عبر نموذج جوجل Nano Banana Pro

يُعد Nano Banana Pro ترقية جوهرية للجيل الأول من Nano Banana، وهو مصمم ليخدم طيفاً واسعاً من المستخدمين، بدءاً من المبدعين والطلاب وصولاً إلى المتخصصين والمؤسسات. يمكن للمستخدمين الآن تجربة قدراته المتقدمة عبر تطبيق Gemini للحصول على حصص استخدام مجانية محدودة يوميًا.

تحويل أي فكرة إلى تصميم جاهز

يتيح هذا النموذج إمكانية تحويل أي تصور ذهني إلى مخطط بصري متكامل، سواء كان نموذجاً أولياً (Prototype)، أو إنفوغرافيك معقد، أو حتى تحويل الملاحظات المكتوبة بخط اليد إلى مخططات منسقة آلياً. الميزة الأبرز هي آلية "الارتكاز على البحث" (Search grounding)، التي تضمن أن النموذج لا يعتمد فقط على بيانات التدريب القديمة، بل يتصل مباشرة بنتائج بحث جوجل الآنية لجلب معلومات دقيقة ومحدثة. فعلى سبيل المثال، يمكن أن يُنشئ صورة لخريطة طقس القاهرة الحالية أو إنفوغرافيك تفصيلي لمباراة كرة قدم جرت للتو، معتمداً على البيانات الحية.

تحويل أي فكرة إلى تصميم جاهز باستخدام الذكاء الاصطناعي
صورة مولّدة بالذكاء الاصطناعي – جوجل

نصوص دقيقة ومتعددة اللغات داخل الصورة

أحد أهم التطورات في Nano Banana Pro هو التفوق في التعامل مع النصوص المضمنة داخل الصور. فالنموذج قادر على إنتاج فقرات نصية طويلة، وتصميم شعارات متقدمة، وكتابة فنية (Calligraphy) بأنماط متنوعة، مع دعم ممتاز للغات المختلفة وترجمة محتوى الصورة بشكل مباشر دون التسبب في تشويه بصري للتصميم. وتؤكد جوجل أن هذا هو أفضل أداء لديها حتى الآن في دقة ووضوح النصوص داخل الصور المولدة.

إنشاء نصوص دقيقة بلغات متعددة داخل الصور المولدة
صورة مولّدة بالذكاء الاصطناعي – جوجل
قدرة النموذج على دمج النصوص المعقدة بأسلوب فني
صورة مولّدة بالذكاء الاصطناعي – جوجل

دمج الصور بطريقة فريدة

يقدم النموذج خاصية دمج فريدة تسمح للمستخدم بجمع ما يصل إلى 14 صورة مختلفة في مشهد واحد متماسك، مع الحفاظ على هوية ما يصل إلى 5 شخصيات داخل هذا المشهد دون فقدان الاتساق البصري. هذه القدرة تجعله أداة مثالية لصناعة المحتوى التسويقي، وتصميم الواجهات، وحتى في مجالات السينما والأزياء، حيث يمكن تحويل الرسومات الأولية (Sketches) إلى نماذج ثلاثية الأبعاد واقعية للغاية.

دمج صور متعددة في مشهد واحد بانسجام
صورة مولّدة بالذكاء الاصطناعي – جوجل
الحفاظ على هوية الشخصيات عند دمج الصور
صورة مولّدة بالذكاء الاصطناعي – جوجل

تحكم إبداعي بجودة سينمائية

يُزود Nano Banana Pro المحترفين بأدوات تحرير متقدمة تحاكي العمل في استوديوهات التصوير السينمائي. تشمل هذه الأدوات التحرير الموضعي الدقيق لأجزاء محددة من الصورة (Localized editing)، والتحكم في زوايا الكاميرا، وتعديل عمق المجال ونقطة التركيز (Depth of field)، وتطبيق تصحيحات لونية احترافية، ومحاكاة تقنيات الإضاءة السينمائية مثل (Chiaroscuro)، وحتى تحويل المشاهد من نهار إلى ليل. يدعم النموذج أيضاً نسب أبعاد مختلفة ودقة تصل إلى 2K و 4K، مما يجعله ملائماً لأغراض الطباعة والنشر واسع النطاق.

أدوات تحرير احترافية بجودة سينمائية
صورة مولّدة بالذكاء الاصطناعي – جوجل
تطبيق تقنيات الإضاءة السينمائية في الصور المولدة
صورة مولّدة بالذكاء الاصطناعي – جوجل
إخراج الصور بدقة عالية تناسب النشر والطباعة
صورة مولّدة بالذكاء الاصطناعي – جوجل

شفافية عالية للمحتوى المولّد بالذكاء الاصطناعي

شددت جوجل على تعزيز الأمان والشفافية من خلال دمج تقنية SynthID، وهي علامة رقمية خفية تُضمن تلقائيًا في الصور المولدة. يمكن للمستخدمين استخدام تطبيق Gemini للتحقق من مصدر أي صورة للتأكد مما إذا كانت نتاج نماذج جوجل، مع التخطيط لتوسيع هذه الميزة لتشمل محتوى الصوت والفيديو مستقبلاً. وبالإضافة إلى العلامة الخفية، يظهر وسم مرئي للمستخدمين في الخطط المجانية و Google AI Pro، بينما يتم إزالة هذه العلامة بالكامل لمشتركي Google AI Ultra وللمطورين عبر Google AI Studio. كما تلتزم جوجل بمعايير C2PA العالمية لتمييز المحتوى المنشأ بواسطة الذكاء الاصطناعي بشفافية موحدة.

تقنية SynthID لتمييز المحتوى المولّد
صورة مولّدة بالذكاء الاصطناعي – جوجل

إطلاق Nano Banana Pro عبر منظومة جوجل

أشارت الشركة إلى أن نموذج Nano Banana Pro بدأ ينتشر بشكل متدرج في مختلف منتجات جوجل، سواء للمستخدمين عبر تطبيق Gemini عالمياً، أو داخل ميزة الذكاء الاصطناعي المدمجة في بحث جوجل. يتوفر النموذج أيضاً في منصة NotebookLM (للتدوين والدراسة)، بالإضافة إلى حضوره القوي في أدوات المحترفين مثل Google Ads، و Google Slides، وأداة Google Vids الجديدة. أما المطورون، فيمكنهم الوصول إليه عبر Gemini API و Google AI Studio، ومنصة Google Antigravity، و Vertex AI الموجهة للإنتاج المؤسسي الكبير، مع خطط لإطلاق Gemini Enterprise قريباً. وصناع المحتوى المرئي والسينمائي سيستفيدون من أداة Flow الجديدة المتاحة أولاً لمشتركي خطة Ultra.

انتشار نموذج Nano Banana Pro في منتجات جوجل
صورة مولّدة بالذكاء الاصطناعي – جوجل

انتقال من تحرير الصور إلى “ذكاء بصري كامل”

تعتبر جوجل أن Nano Banana Pro يمثل المرحلة التأسيسية لـ "الذكاء البصري الكامل"، حيث يتجاوز مجرد تحرير الصور ليصبح قادراً على تحليل البيانات وتلخيص المعلومات بشكل مرئي ودعم المصممين والمخرجين وتسريع تطوير الحملات الإعلانية عبر تحويل الأفكار المجردة إلى نماذج فائقة الواقعية. تجدر الإشارة إلى أن النسخة الأولى من Nano Banana استقطبت أكثر من 13 مليون مستخدم جديد لتطبيق Gemini في أربعة أيام فقط، ويهدف Nano Banana Pro إلى توسيع هذا النطاق ليشمل الاستخدامات الاحترافية والسينمائية بشكل أعمق.

بهذا الإطلاق، تؤكد جوجل سعيها لقيادة السباق المتسارع في مجال الذكاء الاصطناعي البصري، متقدمة بفضل قدراتها الاستدلالية ودعمها للبيانات الواقعية والتحكم الإبداعي عالي الدقة. يفتح النموذج حقبة جديدة من إنتاج الصور التي لا تُولّد من فراغ، بل تُنشأ بفهم عميق لما تحتويه وما يحيط بها.

ما هي أبرز التطورات التي قدمها نموذج Gemini Nano Banana Pro مقارنة بأسلافه؟

التحسينات الرئيسية تكمن في زيادة الدقة والتخصيص، والقدرة الفائقة على دمج النصوص الطويلة والمتعددة اللغات داخل الصور بوضوح، والأهم هو دمج آلية الارتكاز على البحث المباشر في بيانات جوجل الحية، مما يضمن حداثة المحتوى البصري الناتج.

كيف يضمن نموذج جوجل الجديد شفافية الصور المولّدة؟

تعتمد جوجل على تقنية SynthID، وهي علامة مائية رقمية غير مرئية تُضمّن في الصور المولّدة لتمكين التحقق من مصدرها. كما توجد علامة مائية مرئية في الخطط المجانية، مع الالتزام ببروتوكول C2PA العالمي للتمييز الموحد.

هل النسخة الجديدة متاحة للجميع في الوقت الحالي؟

نعم، النموذج متاح عالمياً في تطبيق Gemini ضمن خيار "Create image"، ويقدم حصص استخدام مجانية محدودة. كما سيتم إطلاقه تدريجياً عبر مجموعة واسعة من منتجات جوجل الأخرى مثل NotebookLM و Google Ads.

ما هو الدور الذي يلعبه "الارتكاز على البحث" (Search Grounding) في جودة الصور؟

يلعب هذا الدور دوراً حاسماً؛ فهو يسمح للنموذج بالوصول إلى معلومات الإنترنت الحالية والتحقق منها، مما يضمن أن الصور التي تحتوي على بيانات (مثل الطقس أو النتائج الرياضية) تكون دقيقة ومحدثة، بدلاً من مجرد تخمين النتيجة.

هل توفر جوجل أدوات تحرير متقدمة مع Nano Banana Pro؟

بالتأكيد، يوفر النموذج أدوات احترافية تشمل التحرير الموضعي الدقيق، وتعديل زوايا الكاميرا وعمق المجال، ومحاكاة الإضاءة السينمائية، بالإضافة إلى دعم دقة 4K، مما يمنح المستخدم تحكماً إبداعياً غير مسبوق.

🔎 في الختام، يمثل إطلاق جوجل لنموذج Nano Banana Pro خطوة استراتيجية هامة نحو دمج الذكاء الاصطناعي التوليدي مع الواقعية القائمة على البيانات المباشرة. هذه القدرات المتفوقة في توليد النصوص والتحكم البصري الدقيق تضعه في صدارة المنافسة، وتفتح آفاقاً واسعة للمصممين وصناع المحتوى لتنفيذ رؤى كانت تعتبر مستحيلة أو تتطلب جهداً كبيراً في السابق، مما يؤكد أن المستقبل البصري سيكون مدعوماً بالذكاء والفهم العميق للبيانات.

ليست هناك تعليقات
إرسال تعليق

قم بالتعليق على الموضوع

إعلان وسط الموضوع

ad

إعلان أخر الموضوع

Ad
Back to top button