في خطوة تعزز ريادتها في مجال الذكاء الاصطناعي، كشفت شركة OpenAI عن تحديث جوهري لآليات إنتاج الصور داخل منصة ChatGPT. هذا التحديث لا يقتصر فقط على تحسين الجودة البصرية، بل يضيف ما أسمته الشركة "قدرات التفكير"، وهي ميزة تمنح النموذج القدرة على البحث عبر شبكة الإنترنت وصياغة مجموعات صور مترابطة بناءً على توجيه نصي واحد وبسيط.
- ✅ دمج ميزة "التفكير" لتحليل بنية الصور وربطها بالمعلومات المتاحة عبر الإنترنت.
- ✅ القدرة على إنتاج حتى 8 صور متسقة في وقت واحد مع الحفاظ على الشخصيات والأسلوب.
- ✅ دعم فائق لتوليد النصوص داخل الصور بمختلف اللغات وبدقة تصل إلى 2K.
- ✅ توفير ميزات متقدمة لإنشاء قصص "المانغا" والإنفوجرافيك التعليمي والاحترافي.
يعتمد هذا التحول التقني على نموذج GPT Image 2 الجديد كلياً، والذي صُمم ليعزز دقة تنفيذ التعليمات المعقدة. يبرع النموذج في الحفاظ على التفاصيل الدقيقة التي يحددها المستخدم، مع تحسين ملحوظ في كيفية عرض النصوص داخل التصاميم. وعند تفعيل "وضع التفكير"، يستطيع النموذج تحليل البيانات المرفوعة من قبل المستخدم وتحويلها إلى شروحات بصرية (إنفوجرافيك) دقيقة، مستفيداً من قدرته على الوصول إلى المعلومات المحدثة عبر الويب.
آفاق جديدة لمصممي القصص والمحتوى الرقمي
من أبرز ما يميز الإصدار الجديد هو قدرته على توليد سلسلة من الصور (تصل إلى 8 صور) في دفعة واحدة، مع ضمان بقاء العناصر الأساسية مثل الشخصيات، الأغراض، والنمط الفني ثابتة عبر جميع المشاهد. هذه الميزة تفتح أبواباً واسعة لمبدعي قصص "المانغا" اليابانية ومصممي محتوى منصات التواصل الاجتماعي الذين يحتاجون إلى استمرارية بصرية في أعمالهم. كما يدعم توليد الصور أنماطاً فنية متعددة تشمل فن البكسل، واللقطات السينمائية، والرسوم التوضيحية، وكل ذلك بدقة احترافية ونسب عرض متنوعة.
وفيما يخص معالجة النصوص، حققت OpenAI قفزة نوعية في قدرة النموذج على كتابة الكلمات داخل الصور، خاصة في اللغات غير اللاتينية، مما يحل واحدة من أكبر التحديات التي كانت تواجه نماذج الذكاء الاصطناعي السابقة. كما تم تحسين عرض النصوص باللغة الإنجليزية لتظهر بشكل أكثر وضوحاً وتناسقاً مع التصميم العام.
التوفر وخطط الوصول للمستخدمين
أعلنت الشركة أن نموذج ChatGPT Images 2.0 أصبح متاحاً رسمياً بدءاً من اليوم لجميع مستخدمي ChatGPT ومنصة البرمجة Codex. ومع ذلك، فقد خصصت OpenAI مزايا "التفكير" المتطورة لمشتركي الخطط المدفوعة، بما في ذلك ChatGPT Plus، وChatGPT Pro، وChatGPT Business، لضمان تقديم تجربة أداء فائقة للمحترفين.
يأتي هذا الإطلاق في وقت يشتد فيه السباق التكنولوجي، حيث تسعى OpenAI للحفاظ على تفوقها أمام أدوات منافسة قوية مثل أداة جوجل المتطورة:
بالإضافة إلى نموذج MAI-Image-2 من مايكروسوفت، مما يجعل عام 2026 عاماً مفصلياً في تاريخ الإبداع المعتمد على الذكاء الاصطناعي.
ما هي ميزة "التفكير" الجديدة في نموذج GPT Image 2؟
ميزة التفكير تتيح للنموذج التريث لتحليل الطلب بعمق، والبحث في الإنترنت عن سياقات إضافية، وفهم البنية المعقدة للصورة قبل البدء في إنشائها، مما يؤدي إلى نتائج أكثر دقة وواقعية.
هل يمكن إنشاء شخصيات ثابتة في عدة صور مختلفة؟
نعم، يدعم الإصدار الجديد إنتاج ما يصل إلى 8 صور دفعة واحدة مع الحفاظ على السمات الجسدية للشخصيات والملابس والأسلوب الفني عبر جميع الكادرات، وهو أمر مثالي لصناع القصص المصورة.
هل يدعم النموذج الجديد اللغة العربية في الكتابة داخل الصور؟
أشارت OpenAI إلى تحسينات كبيرة في التعامل مع اللغات غير اللاتينية، مما يعني تطوراً ملحوظاً في قدرة النموذج على إدراج نصوص عربية صحيحة ومنسقة داخل التصاميم مقارنة بالإصدارات السابقة.
من هم المستخدمون الذين يمكنهم الاستفادة من هذا التحديث؟
التحسينات الأساسية متاحة لجميع مستخدمي ChatGPT، بينما تقتصر ميزات التفكير المتقدمة والبحث عبر الويب على المشتركين في باقات Plus و Pro و Business.
🔎 يمثل إطلاق GPT Image 2 فصلاً جديداً في كيفية تفاعلنا مع الآلة لتحويل الأفكار المجردة إلى واقع بصري ملموس؛ فمن خلال دمج القدرة على "التفكير" مع التوليد البصري، لم تعد OpenAI تقدم مجرد أداة لرسم الصور، بل شريكاً إبداعياً يفهم السياق، ويبحث عن المعلومة، ويحافظ على وحدة السرد البصري، مما يمهد الطريق لثورة حقيقية في مجالات التصميم، التعليم، والترفيه الرقمي.

قم بالتعليق على الموضوع