أعلنت شركة جوجل اليوم عن إطلاق Gemma 4، أحدث إصداراتها من النماذج المفتوحة التي تم تطويرها بناءً على نفس الأبحاث والتقنيات الرائدة المستخدمة في تطوير نموذج Gemini 3 الشهير. يهدف هذا الإطلاق إلى تمكين المطورين من الوصول إلى قدرات ذكاء اصطناعي فائقة وبكفاءة عالية تتناسب مع مختلف بيئات العمل.
- ✅ متوفر بأربعة أحجام مختلفة لتناسب كافة الأجهزة من الهواتف إلى محطات العمل.
- ✅ يدعم معالجة الفيديو والصور والصوت بشكل أصلي مع دعم أكثر من 140 لغة.
- ✅ مرخص بموجب Apache 2.0، مما يمنح المطورين حرية تجارية كاملة وسيادة رقمية.
- ✅ يتفوق في الأداء على نماذج أكبر منه بـ 20 ضعفاً في مهام المنطق والبرمجة.
أحجام متنوعة لتناسب كافة احتياجات المطورين
يأتي نموذج Gemma 4 في أربعة أحجام متميزة، مصممة لتعمل على كل شيء بدءاً من أجهزة أندرويد وصولاً إلى وحدات معالجة الرسومات في الحواسيب المحمولة ومحطات العمل المتطورة:
- 31B Dense: المصنف كثالث أفضل نموذج مفتوح في العالم وفقاً للوحة صدارة Arena AI للنصوص.
- 26B Mixture of Experts (MoE): الذي يحتل المركز السادس عالمياً في الكفاءة والأداء.
- Effective 4B (E4B): نموذج محسّن للأداء العالي.
- Effective 2B (E2B): نموذج خفيف وسريع للغاية.
لتحقيق أفضل أداء في الأحجام الصغيرة (2 و 4 مليار بارامتر)، تعاونت جوجل مع فرق Pixel وQualcomm وMediaTek. النتيجة هي نماذج قوية يمكن تشغيلها على الهواتف الذكية، وأجهزة Raspberry Pi، وJetson Nano مع زمن استجابة يقترب من الصفر.
قدرات متطورة وسياق معرفي واسع
تؤكد جوجل أن Gemma 4 ينتقل من مجرد الدردشة البسيطة إلى "المنطق المعقد وسير العمل الوكيل"، مشيرة إلى أنه يتفوق على نماذج تزيد عن حجمه بـ 20 ضعفاً. تتميز نماذج الحافة (Edge models) بنافذة سياق تصل إلى 128 ألف توكن، بينما تصل النماذج الأكبر إلى 256 ألف توكن، مما يسمح بمعالجة المستندات الطويلة والمستودعات البرمجية الضخمة في مطالبة واحدة.
تعالج جميع النماذج الفيديو والصور بشكل أصلي، مما يتيح التعرف الضوئي على الحروف (OCR) وفهم المخططات البيانية. كما يتضمن نموذجا E2B وE4B إدخالاً صوتياً أصلياً للتعرف على الكلام وفهمه. بالإضافة إلى ذلك، تم تدريب Gemma 4 بشكل أصلي على أكثر من 140 لغة، مما يجعله عالمياً بحق في تطبيقات الذكاء الاصطناعي.
أبرز مميزات الإصدار الجديد
- التفكير المتقدم: قادر على التخطيط متعدد الخطوات والمنطق العميق، مع تحسينات ملحوظة في اختبارات الرياضيات واتباع التعليمات.
- سير العمل الوكيل (Agentic Workflows): دعم أصلي لاستدعاء الوظائف (Function-calling)، ومخرجات JSON المنظمة، مما يتيح بناء وكلاء مستقلين يتفاعلون مع الأدوات وواجهات البرمجة (APIs).
- توليد الأكواد البرمجية: يدعم Gemma 4 إنشاء أكواد عالية الجودة دون الحاجة للاتصال بالإنترنت، مما يحول محطة عملك إلى مساعد برمجيات ذكي ومحلي.
الحرية والسيادة الرقمية مع Apache 2.0
يتم إصدار Gemma 4 تحت ترخيص Apache 2.0 الصديق للأعمال والتجارة. يوفر هذا الترخيص مفتوح المصدر أساساً للمرونة الكاملة للمطورين والسيادة الرقمية، حيث يمنحك تحكماً كاملاً في بياناتك، وبنيتك التحتية، ونماذجك. يتيح لك البناء بحرية والنشر بأمان في أي بيئة، سواء كانت محلية أو سحابية.
يمكنك الوصول إلى نماذج Gemma 4 عبر Google AI Studio (لأحجام 31B و 26B MoE) أو في Google AI Edge Gallery (لأحجام E4B و E2B). كما يمكنك الحصول على أوزان النماذج من خلال الروابط التالية:
ما هي الأحجام المتاحة لنموذج Gemma 4؟
يتوفر النموذج بأربعة أحجام رئيسية: 31B Dense للأداء الفائق، 26B MoE للكفاءة العالية، وEffective 4B وEffective 2B للأجهزة المحلية والمحمولة.
هل يمكن تشغيل Gemma 4 على الهواتف الذكية؟
نعم، تم تحسين نموذجي E2B و E4B للعمل على الهواتف الذكية وأجهزة الحافة مثل Raspberry Pi مع زمن استجابة منخفض جداً وبشكل محلي تماماً.
ما الذي يميز ترخيص Apache 2.0 في هذا الإصدار؟
هذا الترخيص يسمح للمطورين والشركات باستخدام النموذج وتعديله وتوزيعه تجارياً دون قيود معقدة، مما يضمن لهم السيادة الكاملة على تطبيقاتهم وبياناتهم.
هل يدعم النموذج اللغة العربية والوسائط المتعددة؟
بالتأكيد، تم تدريب Gemma 4 على أكثر من 140 لغة بما فيها العربية، كما يدعم معالجة الصور والفيديو والصوت بشكل مدمج وأصلي.
🔎 في الختام، يمثل Gemma 4 خطوة عملاقة من جوجل نحو ديمقراطية الذكاء الاصطناعي، حيث يجمع بين القوة المذهلة لنماذج Gemini وبين مرونة المصادر المفتوحة. سواء كنت مطور تطبيقات هواتف أو باحثاً في هندسة الذكاء الاصطناعي، فإن هذا النموذج يوفر لك الأدوات اللازمة للابتكار دون حدود وبأعلى مستويات الأمان والخصوصية.
قم بالتعليق على الموضوع