بدت شركة آبل بطيئة في القفز على عربة الذكاء الاصطناعي التوليدي، لكنها جديدة بحث المتعلقة بفهم السياق يمكن أن تجعل Siri أفضل من ChatGPT.
كان عملاق التكنولوجيا صامتا بشكل ملحوظ خلال الأزمة الحادة صعود ChatGPT والوابل اللاحق من أدوات وميزات الذكاء الاصطناعي التوليدية من شركات مثل جوجل, مايكروسوفتو ميتا. لكن لدى باحثي شركة Apple نموذجًا جديدًا يمكن أن يمنح Siri ترقية الذكاء الاصطناعي التوليدية التي كان يأملها معجبو Apple.
وقال الباحثون: “يحتوي الكلام البشري عادةً على إشارات غامضة مثل “هم” أو “ذاك”، والتي يكون معناها واضحًا (للبشر الآخرين) بالنظر إلى السياق”. تقترح المقالة نموذجًا يسمى ReALM (الدقة المرجعية كنمذجة لغة) والذي يعالج مشكلة عدم قدرة نماذج اللغات الكبيرة (LLM) دائمًا على فهم السياق عندما يتعلق الأمر بالمراجع التي تظهر على الشاشة والمحادثة والخلفية (مثل التطبيقات أو الميزات قيد التشغيل في الخلفية) بهدف تحقيق “تجربة حقيقية بدون استخدام اليدين في المساعدين الصوتيين”.
على الرغم من أن ChatGPT جيد جدًا ويفهم بعض أنواع السياق، إلا أن الباحثين قالوا إن ReALM يتفوق على GPT-3.5 وGPT-4 (اللذان يعملان على تشغيل الإصدارات المجانية والمدفوعة من ChatGPT) في جميع اختبارات السياق الخاصة به. إليك ما يمكن أن يعنيه ذلك بالنسبة لسيري.
1. القرائن السياقية التي تظهر على الشاشة
قام باحثو Apple بتدريب ReALM باستخدام البيانات “التي تظهر على الشاشة” من صفحات الويب، بما في ذلك معلومات الاتصال، مما يسمح للنموذج بفهم النص من لقطات الشاشة (مثل العناوين والعناوين وتفاصيل الحساب المصرفي). على الرغم من أن GPT-4 يمكنه أيضًا فهم الصور، إلا أنه لم يتم تدريبه على لقطات الشاشة، والتي تقول الصحيفة إنها تسمح لـ ReALM بفهم المعلومات التي تظهر على الشاشة بشكل أفضل والتي من أجلها يرى المستخدمون أن Apple تطلب المساعدة من Siri.
2. الفهم التحادثي والسياقي
مراجع المحادثة تعني شيئًا ذا صلة بالمحادثة، ولكن ربما لم يتم ذكرها صراحةً في الموجه. من خلال تدريب ReALM على بيانات مثل قوائم الأعمال، يمكن أن يتضمن النموذج مطالبات مثل “اتصل بالصيدليات الموجودة في الأسفل” في إشارة إلى قائمة الصيدليات القريبة المعروضة على الشاشة، دون الحاجة إلى تقديم تعليمات أكثر تحديدًا.
ReALM قادر على فهم “كيانات الخلفية”، أي شيء يعمل في خلفية الجهاز “والذي لا يمثل بالضرورة جزءًا مباشرًا مما يراه المستخدم على شاشته أو تفاعله مع الوكيل الافتراضي”، مثل تشغيل الموسيقى. أو ينطلق إنذار.
3. مدمج بالكامل في الجهاز
أخيرًا وليس آخرًا، تم تصميم ReALM ليكون موجودًا على الجهاز، وهو ما سيكون أمرًا كبيرًا نظرًا لأن LLMs تتطلب قدرًا كبيرًا من قوة الحوسبة وبالتالي فهي تعتمد في المقام الأول على السحابة. بدلاً من ذلك، يعد ReALM بمثابة LLM أصغر، “ولكن تم ضبطه بشكل محدد وصريح لمهمة حل المعايير.” لقد قدمت شركة Apple دائمًا التزامها بالخصوصية كنقطة بيع لأجهزتها. لذلك، فإن الإصدار التوليدي من Siri مع الذكاء الاصطناعي الذي يعمل بالكامل على الجهاز سيكون مرتبطًا جدًا بالعلامة التجارية وإنجازًا كبيرًا للأجهزة التي تتمتع بقدرات الذكاء الاصطناعي.
لقد كانت شركة Apple متشددة كما هو متوقع بشأن خططها للذكاء الاصطناعي، لكن الرئيس التنفيذي تيم كوك قال ذلك من المتوقع صدور إعلان كبير حول الذكاء الاصطناعي في وقت لاحق من هذا العام، تتجه كل الأنظار إلى مؤتمر Apple للمطورين العالمي (WWDC) المقرر انعقاده 10 يونيو.
المواضيع
تفاحة
ذكاء إصطناعي