على الرغم من أن Gemini Live يعتمد حاليًا على نموذج 2.5 Flash، تشير أحدث إصدارات النسخة التجريبية من تطبيق جوجل إلى أن ترقيات كبيرة قادمة قريبًا. تستعد جوجل لتعزيز تجربة التفاعل الحي بشكل كبير، مما يوفر للمستخدمين قدرات أكثر عمقًا وذكاءً في المحادثات المرئية.
- ✅ الكشف عن "وضع التفكير المباشر" (Live Thinking Mode) الذي يهدف إلى تقديم استجابات أكثر تفصيلاً وعمقًا.
- ✅ إدراج مجموعة من "الميزات التجريبية المباشرة" التي تشمل الذاكرة متعددة الوسائط والتعامل المحسن مع الضوضاء.
- ✅ التلميحات تشير إلى أن هذه التحسينات ستدعم الانتقال إلى نماذج أحدث مثل Gemini 3.
- ✅ ظهور ميزات متقدمة مثل التحكم في واجهة المستخدم والبحث العميق ضمن الميزات التجريبية القادمة.
في أعقاب إطلاق نموذج Gemini 3 Pro في نوفمبر الماضي، قدمت جوجل مفهوم "ميزات المختبرات" (Labs) التي تتيح للمستخدمين تجربة القدرات الناشئة مثل وكيل Gemini (Gemini Agent) والعرض الديناميكي (Dynamic View). وتكشف نسخة جوجل التطبيق رقم 17.2 عن العمل على أربع قدرات رئيسية ضمن هذه المختبرات، والتي ستؤثر بشكل مباشر على تجربة Gemini Live.
تفاصيل الميزات التجريبية القادمة لـ Gemini Live
تستهدف هذه الميزات الجديدة سد الفجوة بين التفاعل السريع والاستجابة المتعمقة. يشير ظهور "وضع التفكير المباشر" إلى أن Gemini Live قد يبدأ في استخدام نماذج أكثر قوة مثل نماذج التفكير (Thinking) أو Pro لتقديم إجابات تتطلب تحليلًا أعمق.
أما قسم "الميزات التجريبية المباشرة" فيعد بتجارب متطورة تشمل:
- الذاكرة متعددة الوسائط: القدرة على تذكر السياق البصري والمحادثات السابقة.
- تحسين التعامل مع الضوضاء: معالجة أفضل للبيئات الصوتية الصاخبة لضمان فهم الأوامر بشكل أدق.
- الاستجابة المرئية: قدرة النموذج على الرد استنادًا إلى ما يراه عبر الكاميرا، وهو ما قد يكون مرتبطًا بمشروع Astra.
- النتائج المخصصة: استخدام بيانات من تطبيقات جوجل الأخرى لتقديم استجابات أكثر ملاءمة للمستخدم.
يُعتقد أن هذه الميزات التجريبية تعكس القدرات التي تم تقديمها سابقًا في تجربة الدردشة مع Gemini 3 Flash و Pro، وخاصةً ميزة الذكاء الشخصي (Personal Intelligence) التي تتضمن ربط التطبيقات واستعراض محادثات Gemini السابقة. يمكن للمستخدمين المهتمين بتطورات الذكاء الاصطناعي متابعة آخر المستجدات حول Gemini Pro.
قدرات "المختبرات" الأخرى قيد التطوير
بالإضافة إلى التحديثات المباشرة، تظهر ميزات أخرى ضمن المختبرات تشير إلى مستقبل أكثر تكاملاً لـ Gemini على نظام أندرويد، خاصةً فيما يتعلق بالمهام الآلية والبحث المعقد:
- التحكم في واجهة المستخدم (UI Control): حيث يتمكن الوكيل من التحكم في الهاتف لإكمال المهام المطلوبة، وهو ما يتماشى مع توقعات ظهور Gemini Agent على أندرويد كجزء من أتمتة استخدام الحاسوب.
- البحث العميق (Deep Research): القدرة على تفويض مهام بحثية معقدة تتطلب تجميع ومعالجة كميات كبيرة من المعلومات.
هذا التوسع في قدرات Gemini Live والميزات التجريبية يؤكد التزام جوجل بدمج نماذجها اللغوية الكبيرة بعمق في تجربة المستخدم اليومية عبر الأجهزة المحمولة، مما يجعل التفاعل مع المساعد الرقمي أكثر طبيعية وذكاءً.
ما هو النموذج الأساسي الذي يعتمد عليه Gemini Live حاليًا؟
يعتمد Gemini Live حاليًا على نموذج Gemini 2.5 Flash، ولكنه من المتوقع أن ينتقل لاستخدام نماذج أقوى مثل Gemini 3 لتمكين الميزات الجديدة مثل وضع التفكير المباشر.
ماذا يعني "وضع التفكير المباشر" للمستخدم؟
يعني وضع التفكير المباشر أن Gemini سيأخذ وقتًا أطول لمعالجة الطلبات لتقديم استجابات أكثر تفصيلاً وعمقًا، بدلاً من الاكتفاء بالإجابات السريعة.
هل تشمل الميزات التجريبية الجديدة تحسينًا للصوت؟
نعم، تشمل الميزات التجريبية تحسينات في التعامل مع الضوضاء (better noise handling)، مما يشير إلى تطوير قدرات فهم الأوامر الصوتية في البيئات الصاخبة.
ما هي "الذاكرة متعددة الوسائط" المذكورة في التحديثات؟
تشير الذاكرة متعددة الوسائط إلى قدرة Gemini على الاحتفاظ بسياق المعلومات المرئية والمحادثات السابقة، مما يسمح له بتقديم استجابات أكثر ترابطًا عبر جلسات متعددة.
🔎في الختام، من الواضح أن جوجل تعمل بقوة على تحويل Gemini Live من مجرد مساعد استجابة سريعة إلى شريك تفاعلي قادر على الفهم العميق والقيام بمهام معقدة، مدعومًا بتقنيات الذكاء الاصطناعي المتقدمة التي تظهر تباعاً في النسخ التجريبية للتطبيقات، مما يمهد الطريق لتجربة مستخدم أكثر ثراءً وتخصيصًا في المستقبل القريب.
قم بالتعليق على الموضوع