جيميني Gemini: قدرات ومميزات نموذج جوجل الأقوى

جيميني Gemini: قدرات ومميزات نموذج جوجل الأقوى

أعلنت شركة جوجل Google اليوم رسميا عن Gemini جيميني، وهو نموذج الذكاء الاصطناعي AI الأكثر قدرة وشمولا، والذي أعلنت تزويد العديد من خدماتها ومنتجاتها به لتوفير مزايا أكثر ذكاء، بما في ذلك روبوت الدردشة بارد Bard وأحدث هواتفها الذكية الرائدة بكسل 8 برو.

وقال ديميس هاسابيس الرئيس التنفيذي والشريك المؤسس لشركة DeepMind المملوكة لجوجل والذي يقود جهود الشركة المتعلقة بمنتجات الذكاء الاصطناعي AI، أن جيميني Gemini يأتي نتيجة لجهود مختلف فرق العمل في جوجل، وأن الشركة طورته من الألف إلى الياء ليكون نموذجا متعدد الوسائط، أي قادر على فهم مختلف أنواع البيانات بما في ذلك النصوص والأكواد البرمجية والصوت والصورة والفيديو.

ما هو نموذج الذكاء الاصطناعي جيميني Gemini من جوجل ؟

ويعتبر نموذج الذكاء الاصطناعي الجديد من جوجل جيميني Gemini هو أحدث وأقوى نموذج أعلنت عنه الشركة العملاقة، وهو المنافس الأبرز الآن لنموذج GPT-4 من شركة OpenAI التي تطور شات جي بي تي ChatGPT، لكنه وفقا لبيانات جوجل أكثر قدرة وذكاء في فهم البيانات بمختلف أنواعها.

وبالإضافة إلى قدرة نموذج جيميني الجديد لمعالجة النصوص والصور ومقاطع الفيديو والأصوات، تقول جوجل أن Gemini يتميز بالمرونة، حيث يمكن تشغيله بكفاءة على مختلف الأجهزة التطبيقات، بما في ذلك مراكز البيانات وحتى الأجهزة المحمولة، حيث يتوفر جيميني بثلاثة أحجام تشمل Gemini Ultra وهو الإصدار الأقوى من النموذج الذي يمكن الاعتماد عليه في أداء المهام المعقدة الكبيرة، بالإضافة إلى Gemini Pro الذي يعتبر نسخة مخصصة من النموذج قادرة على أداء مجموعة واسعة من المهام بكفاءة، إلى جانب Gemini Nano الذي يمكن الاعتماد عليه لأداء المهام على الأجهزة نفسها، مثل الهواتف الذكية.

ما هي قدرات جيميني Gemini ؟

ووفقا لاختبارات جوجل لنموذج الذكاء الاصطناعي الجديد الخاص بها جيميني Gemini، فإن أداء Gemini Ultra (الإصدار الأقوى من النموذج) تفوق في 30 معيارا أكاديميا من أصل 32 معيارا لتقييم أداء نماذج اللغات الكبيرة (LLM)، وذلك على النماذج اللغوية المنافسة بما في ذلك GPT-4.

 قدرات جيميني Gemini

وجاءت نتائج اختبار قدرات جيميني كالتالي:

  • تخطى Gemini Ultra حاجز 90 في المئة في اختبار MMLU لقياس المعرفة، وهو ما يجعله أول نموذج لغوي للذكاء الاصطناعي يتخطى الخبراء البشريين في هذه الاختبارات، والتي تستخدم مجموعة متنوعة من 57 مادة تشمل الرياضيات والفيزياء والتاريخ والقانون والطب وغيرها لقياس المعرفة العامة والقدرة على حل المشاكل، مقارنة مع 86.4% بالنسبة لنموذج GPT-4.
  • حقق Gemini Ultra أيضا درجة متقدمة تبلغ 59.4% في معيار MMMU الجديد، والذي يتضمن مهام متعددة الوسائط تغطي مجالات مختلفة تتطلب تفكيرا مدروسا.
  • يتفوق جيميني في القدرة على أداء جميع المهام متعددة الوسائط.
  • تقول جوجل أن جيميني الترا تفوق على النماذج اللغوية الأخرى في التعرف على الصور والأشياء التي تتضمنها، وذلك دون مساعدة من أنظمة التعرف على أحرف الكائنات (OCR) التي تستخرج النص من الصور لمزيد من المعالجة.
  • Gemini قادر على التعرف على النصوص والصور والصوت وفهمها وغير ذلك الكثير في نفس الوقت، مما يجعله قادرا على فهم المعلومات الدقيقة أفضل والإجابة على الأسئلة المتعلقة بالموضوعات المعقدة، بما في ذلك الرياضيات والفيزياء.
  • قدرات متقدمة لفهم وشرح وإنشاء الأكواد البرمجية عالية الجودة، مع دعم أكثر لغات البرمجة شعبية مثل بايثون وجافا و++C وجو Go، مع دعم محرك إنتاج الأكواد البرمجية AlphaCode 2، مما يجعله يتفوق في حل مشاكل البرمجة التنافسية التي تتجاوز البرمجة لتشمل الرياضيات المعقدة وعلوم الكمبيوتر النظرية.

ما هي مميزات جيميني Gemini ؟ كيف تستفيد منه ؟

ونشرت جوجل مقطع فيديو يوضح مميزات جيميني وكيفية الاستفادة من قدارته، بما في ذلك القدرة على التعرف على محتوى الصور ومقاطع الفيديو لحظيا والإجابة عن الأسئلة المتعلقة بها، بما في ذلك الاستدلال المكاني والمنطق، بحيث يمكن على سبيل المثال عرض صور من المجموعة الشمسية وطلب ترتيبها، أو عرض صورة لسيارتين تنحدران على طريق والسؤال عن الأسرع بينهما.

كما يمكن عرض صور متتابعة من مشهد ما والطلب من Gemini تخمين اسم الفيلم، ومن الأمثلة المدهشة التي عرضتها جوجل للتدليل على قدرات جيميني إمكانية حل الألغاز مثل التعرف على لعبة لتخمين العملة في أي يد وتخمين اليد التي بها العملة، أو حتى التخمين في لعبة تبديل الأكواب التقليدية.

متى يتوفر نموذج جيميني Gemini للذكاء الاصطناعي من جوجل ؟

وقالت جوجل أن نموذج الذكاء الاصطناعي المتطور جيميني الخاص بها يتوفر من اليوم وخلال الأسابيع والأشهر المقبلة، وذلك من خلال خدماتها وتطبيقاتها المختلفة.

جوجل بارد مزود بنموذج جيميني

وأكدت جوجل أن روبوت الدردشة بارد Bard الخاص بها سيعتمد من اليوم على نسخة معدلة من Gemini Pro، وهو ما يمنحه أكبر ترقية على الإطلاق منذ إطلاقه، مع قدرة أكبر على التفكير والتخطيط والفهم المتقدم وغيرها.

لكن جوجل قالت أن جيميني برو في بارد Bard سيتوفر في البداية بالإنجليزية فقط في 170 دولة حول العالم، على أن يتوفر لاحقا في المزيد من الدول بالمزيد من اللغات.

جيميني في هواتف بكسل

ويجلب تحديث بكسل Pixel Drops لشهر ديسمبر 2023 دعم Gemini Nano لمستخدمي أحدث هواتف بكسل الرائدة بكسل 8 برو Pixel 8 Pro، مما يوفر العديد من المميزات الذكية، بما في ذلك تلخيص النصوص في تطبيق تسجيل الصوت Recorder، بالإضافة للردود الذكية في لوحة مفاتيح Gboard، وهي الميزة التي تدعم تطبيق واتساب Whatsapp في البداية، على أن تدعم المزيد من أفضل تطبيقات التراسل في وقت لاحق من العام المقبل 2024.

وتخطط جوجل لتزويد مختلف منتجاتها وخدماتها بما في ذلك البحث والإعلانات وكروم والمساعد الذكي Duet AI بمميزات جيميني Gemini، وقالت الشركة أنها بدأت بالفعل في اختبار الاعتماد على أحدث نموذج للذكاء الاصطناعي من خلال تجربتها الجديدة للبحث SGE، وهو ما يوفر استجابة أسرع في الرد بنسبة 40% على الاستعلامات باللغة الإنجليزية.

جيميني Gemini للمطورين

ويمكن للمطورين وعملاء المؤسسات بداية من 13 ديسمبر 2023 الوصول إلى Gemini Pro وبناء تطبيقات استنادا عليه، وذلك عبر واجهة برمجة التطبيقات Gemini API في Google AI Studio أو من خلال Google Cloud Vertex AI.

متى يتوفر Gemini Ultra ؟

أما عن أقوى إصدارات جيميني Gemini Ultra، قالت جوجل أنها تجري الآن المزيد من فحوصات السلامة الشاملة قبل توفيره على نطاق واسع، بحيث تختبره الآن مع مجموعة مختارة من العملاء والمطورين والشركاء وخبراء السلامة والمسؤولية لإجراء التجارب المبكرة وإبداء التعليقات قبل طرحه للمطورين وعملاء المؤسسات في أوائل 2024.

كما تخطط جوجل لطرح Bard Advanced وهو إصدار أقوى وأكثر ذكاء من روبوت الدردشة بارد اعتمادا على جيميني الترا، وذلك في وقت مبكر من العام المقبل 2024.