جوجل أعلنت للتو (ولكن لم يتم إصدارها) عن Gemini 1.5، وهو تحديث لنموذج اللغة الرئيسي الخاص بها – النموذج المستخدم في chatbot المعروف سابقًا باسم Bard، ولكن بالتآزر أعيدت تسميته الجوزاء منذ أسبوع.
الادعاء الكبير لهذا الإصدار هو “إنجاز كبير في فهم السياق الطويل عبر الطرائق”. ومن المفترض أيضًا أن تكون خطوة إلى الأمام في الكفاءة، حيث أنها مبنية على نوع من الهندسة المعمارية المعروفة باسم “Mixture-of-Experts (MoE)”، مما يعني أنه من المتوقع أن يكون الأداء مشابهًا لأداء Gemini 1.0، ولكنه يعتمد على طاقة أقل. – وحدات معالجة الرسومات الجائعة. نسعى جاهدين لتحقيق ذلك.
هذا الادعاء الكبير الأول حول الفهم المتعدد الوسائط لـ “السياق الطويل” هو مصطلحات كما يبدو، لكن المؤسس المشارك لشركة Google Deepmind أصدر عرضًا توضيحيًا على X يهدف إلى إظهار ما يعنيه ذلك عمليًا.
من خلال الاستخدام الذكي لجزء كبير من نص الملكية العامة الذي لن يحرج أي مدافع عن حقوق الطبع والنشر – في هذه الحالة، نسخة من 402 صفحة لمهمة ناسا التي هبطت على القمر – ماجستير قادر على التركيز على ما يحتاجه المستخدم (“السياق”) على الرغم من أن الموجه ضخم للغاية (“طويل”)، لذلك يبدو أن هذا هو ما يعنيه “السياق الطويل”.
في العرض التجريبي، يستطيع Gemini 1.5 اختيار ثلاث لحظات مضحكة من نص الرواية. كما أنه قادر على اكتشاف الحدث في النص الذي يطابق صورة طبعة الحذاء القمري – الجزء الذي يمشي فيه نيل أرمسترونج على القمر – وهو ما يفسر ما يفترض أن يعنيه “متعدد الوسائط” في هذا السياق: صورة نموذج التعرف يعمل جنبًا إلى جنب مع LLM.
تعد هذه الترقية جزءًا من جهد مستمر لإبقاء Google في محادثة الذكاء الاصطناعي بعد ذلك OpenAI تناول غداء الجميع على الذكاء الاصطناعي في عام 2022 من خلال النشر ChatGPT. في أواخر العام الماضي، بدأت جوجل في الترويج بجدية للتغييرات القادمة مع Bard والنموذج الذي يدعمها، والذي يظل أيضًا نموذجًا لغويًا كبيرًا، معروف بكونه SHOD في جوجل وأندرويد شعبية يتم استخدام المنتجات فقط كـ ChatGPT لحل المشكلات اليومية وإبهار حفلات الكوكتيل. على وجه الخصوص، روجت ورقة بحثية صدرت في ديسمبر 2023 لنسخة من برج الجوزاء تحتوي على تجاوز أداء OpenAI’s GPT-4 نموذج في بعض الحالات، ويصبح أول ماجستير في القانون يحقق درجة النجاح في اختبار الذكاء الاصطناعي المحدد لـ “فهم لغة المهام المتعددة “أو MLU.
ومن بين الادعاءات الأخرى حول Gemini 1.5، تقول Google إن النموذج الجديد يمكنه تحليل مجموعات كبيرة من البيانات بدقة مذهلة – وفي ادعاء أكثر غرابة قليلاً – يؤدي أداءً جيدًا في منطق على جميع أنواع أنواع البيانات. المنطق هو الضعف الأكثر شهرة في معظم LLMs.
وفقًا للرئيس التنفيذي ساندر بيتشاي، تقدم Google إصدار Gemini 1.5 لمجموعة محدودة. وكتب بيتشاي في مدونة جوجل: “نحن متحمسون لتقديم معاينة محدودة لهذه الميزة التجريبية للمطورين وعملاء المؤسسات”.
ستكون القاعدة الأوسع لمستخدمي Gemini هي الحكم النهائي على أداء Google عندما يُسمح لهم فعليًا بتجربة Gemini 1.5 كجزء من منتج تم إطلاقه رسميًا. تم إطلاق أقوى طراز من Google، وهو Gemini Ultra منذ أسبوعلذلك قد يستغرق الأمر بعض الوقت، وربما يكون من الآمن افتراض أن Gemini 1.5 سيكون يومًا ما جزءًا من حزمة Google المميزة الجديدة – وبعبارة أخرى “المدفوعة” – من منتجات Workspace التي تسمى جوجل وان AI بريميوم.