OpenAI منافسة أنثروبي تطلق نموذجًا قويًا جديدًا للذكاء الاصطناعي يسمى Claude 3.5 Sonnet. لكن هذه خطوة تدريجية أكثر من كونها قفزة هائلة إلى الأمام.
يمكن لـ Claude 3.5 Sonnet تحليل كل من النص والصور بالإضافة إلى إنشاء نص، وهو النموذج الأنثروبي الأكثر قدرة حتى الآن، على الأقل على الورق. في العديد من اختبارات الذكاء الاصطناعي للقراءة والترميز والرياضيات والرؤية، يتفوق كلود 3.5 سونيت على النموذج الذي يحل محله، كلود 3 سونيت، و يتفوق على النموذج الرائد السابق لشركة Anthropic كلود 3 أوبوس.
معالم ليست بالضرورة المقياس الأكثر فائدة لتقدم الذكاء الاصطناعي، ويرجع ذلك جزئيًا إلى أن العديد منهم يختبرون حالات مقصورة على فئة معينة لا تنطبق على الشخص العادي، مثل الإجابة على أسئلة الاختبار الصحي. ولكن مقابل ما يستحق، كلوديوس 3.5 السوناتة بالكاد يتفوق على النماذج المنافسة الرئيسية، بما في ذلك النموذج الذي أصدرته OpenAI مؤخرًا جي بي تي-4oعلى بعض المعايير التي اختبرها الأنثروبيك ضدها.
إلى جانب القالب الجديد، تطلق Anthropic ما تسميه Artifacts، وهي مساحة عمل حيث يمكن للمستخدمين تحرير وإضافة المحتوى (مثل التعليمات البرمجية والمستندات) التي تم إنشاؤها بواسطة قوالب Anthropic. تقول Anthropic إن Artifacts قيد المعاينة حاليًا، وستكتسب ميزات جديدة في المستقبل القريب، مثل طرق التعاون مع فرق أكبر وتخزين قواعد المعرفة.
التركيز على الكفاءة
أداء Claude 3.5 Sonnet أفضل قليلاً من Claude 3 Opus، وتقول Anthropic أن النموذج يفهم بشكل أفضل التعليمات الدقيقة والمعقدة، بالإضافة إلى المفاهيم مثل الفكاهة. (الذكاء الاصطناعي هو من المعروف أنه ليس مضحكاولكن ربما الأهم من ذلك بالنسبة للمطورين الذين يصممون تطبيقات باستخدام Claude والتي تتطلب استجابات سريعة (مثل روبوتات الدردشة لخدمة العملاء)، أن 3.5 Sonnet أسرع. وهذا يعادل ضعف سرعة 3 Opus، كما تدعي Anthropic.
الرؤية – تحليل الصور – هي إحدى المجالات التي تحسنت فيها كلود 3.5 السوناتة بشكل ملحوظ مقارنة بـ 3 أعمال، وفقًا لـ Anthropic. 3.5 يمكن لـ Sonnet تفسير الجداول والرسوم البيانية بشكل أكثر دقة ونسخ النص من الصور “غير الكاملة”، مثل الصور ذات التشوهات والتحف البصرية.
يقول مايكل جيرستنهابر، مدير المنتج في Anthropic، إن التحسينات جاءت نتيجة التعديلات المعمارية وبيانات التدريب الجديدة، بما في ذلك البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي. ما البيانات على وجه التحديد؟ لم يكشف Gerstenhaber عن ذلك، لكنه ألمح إلى أن Claude 3.5 Sonnet يحصل على الكثير من قوته من مجموعات التدريب هذه.
وقال غيرستنهابر لـ TechCrunch: “ما يهم (الشركات) هو ما إذا كان الذكاء الاصطناعي يساعدهم على تلبية احتياجات أعمالهم أم لا، وليس ما إذا كان الذكاء الاصطناعي قادرًا على المنافسة مقابل المعيار أم لا”. “ومن هذا المنظور، أعتقد أن Claude 3.5 Sonnet سيكون متقدمًا على أي شيء لدينا – وأيضًا متقدمًا على أي شيء آخر يحدث في الصناعة.”
يمكن أن تكون السرية المحيطة ببيانات التدريب مدفوعة بأسباب تنافسية. ولكن يمكن أن يتعلق الأمر أيضًا بحماية الأنثروبولوجيا من التحديات القانونية – وخاصة التحديات المتعلقة بها استخدام عادل. لم تقرر المحاكم بعد ما إذا كان لدى البائعين مثل Anthropic ومنافسيها، مثل OpenAI وGoogle وAmazon وما إلى ذلك، الحق في التدريب على البيانات العامة، بما في ذلك البيانات المحمية بحقوق الطبع والنشر، دون تعويض أو اعتماد منشئي هذه البيانات.
كل ما نعرفه هو أن Claude 3.5 Sonnet تم تدريبه على الكثير من النصوص والصور، مثل نماذج Anthropic السابقة، بالإضافة إلى تعليقات من المختبرين البشريين لمحاولة “مواءمة” النموذج مع نوايا المستخدمين، على أمل منعه من نفث المواد السامة أو غيرها. نص إشكالي.
ماذا نعرف؟ حسنًا، النافذة المنبثقة لـ Claude 3.5 Sonnet – مقدار النص الذي يمكن للنموذج تحليله قبل إنشاء نص جديد – هو 200000 رمز، وهو نفس 3 Sonnet. الرموز هي أجزاء مقسمة من البيانات الأولية، مثل المقاطع “مروحة”، و”كومة”، و”علامة” في كلمة “رائع”؛ 200000 رمز يساوي حوالي 150000 كلمة.
ونحن نعلم أن كلود 3.5 السوناتة متاح اليوم. يمكن للمستخدمين المجانيين لعميل الويب Anthropic وتطبيق Claude iOS الوصول إليه مجانًا؛ المشتركون في خطط Anthropic المدفوعة كلود برو و فريق كلود احصل على حدود أسعار أعلى بمقدار 5 مرات. 3.5 Sonnet متاح أيضًا على Anthropic’s API والمنصات المُدارة مثل Amazon Bedrock وVertex AI من Google Cloud.
وقال جيرستنهابر: “يمثل Claude 3.5 Sonnet حقًا خطوة تغيير في الذكاء دون التضحية بالسرعة، كما أنه يعدنا للإصدارات المستقبلية عبر عائلة طرازات Claude بأكملها”.
يقوم Claude 3.5 Sonnet أيضًا بتشغيل القطع الأثرية، والتي تنبثق نافذة مخصصة في عميل الويب Claude عندما يطلب المستخدم من النموذج إنشاء محتوى مثل مقتطفات التعليمات البرمجية أو المستندات النصية أو تصميمات مواقع الويب. يوضح Gerstenhaber: “المصنوعات اليدوية هي مخرجات النموذج التي تضع المحتوى الذي تم إنشاؤه جانبًا وتسمح لك، كمستخدم، بالتكرار على هذا المحتوى. لنفترض أنك تريد إنشاء بعض التعليمات البرمجية: سيتم وضع القطعة الأثرية في واجهة المستخدم، ثم يمكنك التحدث مع كلود وتصفح المستند لتحسينه حتى تتمكن من تشغيل التعليمات البرمجية.
الصورة الكبيرة
إذن، ما مدى أهمية كلود 3.5 السوناتة في السياق الأوسع للأنثروبيين – والنظام البيئي للذكاء الاصطناعي، في هذا الصدد؟
يوضح كلود 3.5 السوناتة أن التقدم التدريجي هو مدى ما يمكن أن نتوقعه حاليًا في النمذجة، باستثناء تحقيق تقدم كبير في البحث. شهدت الأشهر الأخيرة إصدارات رئيسية من Google (الجوزاء 1.5 برو) و OpenAI (GPT-4o) التي تهز الأمور قليلاً من حيث الأداء المعياري والنوعي. ولكن لم تكن هناك خطوة كبيرة لمطابقة القفزة منذ ذلك الحين جي بي تي-3 الى جي بي تي-4 في بعض الوقت، وذلك بسبب جمود بنيات النماذج الحالية والحسابات الهائلة التي تتطلبها للتدريب.
بينما يوجه مقدمو خدمات الذكاء الاصطناعي التوليدي انتباههم إلى الاحتفاظ بالبيانات و رخصة وبدلاً من الوعد بهياكل جديدة قابلة للتطوير، هناك دلائل على أن المستثمرين احرص للمسار الأطول من المتوقع لعائد الاستثمار من الذكاء الاصطناعي التوليدي. يتم تحصين الأنثروبي إلى حد ما من هذا الضغط، كونه في وضع يحسد عليه من أمازون (وبدرجة أقل جوجل) التأمين ضد OpenAI. ولكن دوران الشركة، والتي ينبغي أن تصل أقل بقليل من مليار دولار بحلول نهاية عام 2024، هو جزء من OpenAI – وأنا متأكد من أن أنصار Anthropic لن يسمحوا له بنسيان هذه الحقيقة.
على الرغم من قاعدة العملاء المتنامية التي تشمل علامات تجارية مشهورة مثل Bridgewater وBrave وSlack وDuckDuckGo، لا تزال Anthropic تفتقر إلى طابع مؤسسي معين. ومن المثير للاهتمام أن الذكاء الاصطناعي المفتوح هو الذي يستخدم الذكاء الاصطناعي – وليس الإنسان – دخلت شركة برايس ووترهاوس كوبرز في شراكة مؤخرًا لإعادة بيع عروض الذكاء الاصطناعي التوليدية للشركة.
ولذلك تتخذ شركة Anthropic نهجًا استراتيجيًا ومثبتًا لتحقيق اختراقات، واستثمار وقت التطوير في منتجات مثل Claude 3.5 Sonnet لتقديم أداء أفضل قليلاً بأسعار المواد الخام. سعر 3.5 Sonnet هو نفس سعر 3 Sonnet: 3 دولارات لكل مليون رمز يتم إدخاله في النموذج و15 دولارًا لكل مليون رمز يتم إنشاؤه بواسطة النموذج.
تحدث Gerstenhaber عن هذا خلال محادثتنا. وقال: “عندما تقوم بإنشاء تطبيق، لا ينبغي للمستخدم النهائي أن يعرف النموذج المستخدم أو كيف يقوم المهندس بتحسينه لتجربته، ولكن يمكن أن يكون لدى المهندس الأدوات اللازمة لتحسين هذه التجربة وهي المتجهات التي يجب تحسينها، والتكلفة هي بالتأكيد واحدة منها.
كلوديوس 3.5 السوناتة لا يحل مشكلة الهلوسة. يكاد يكون من المؤكد أنه يرتكب أخطاء. ولكنها قد تكون جذابة بما يكفي لإغراء المطورين والشركات بالانتقال إلى المنصة الإنسانية. وفي نهاية المطاف، هذا هو ما تعنيه الأنثروبيك.
وللغرض نفسه، ضاعفت الأنثروبيك أدواتها وأدواتها القيادة التجريبية بالذكاء الاصطناعيوالذي يسمح للمطورين “بقيادة” الوظائف الداخلية لنماذجها؛ عمليات التكامل للسماح لنماذجها بالعمل في التطبيقات; والأدوات المبنية في الأعلى من نماذجها مثل تجربة القطع الأثرية المذكورة آنفاً. كما قام بتعيين أحد مؤسسي Instagram كـ مدير الإنتاج. و له توافر موسعة لمنتجاتها، حيث قدمت مؤخرًا كلود في أوروبا وافتتحت مكاتب في لندن ودبلن.
يبدو أن الإنسان، بشكل عام، قد توصل إلى فكرة مفادها أن بناء نظام بيئي حول النماذج – وليس فقط النماذج المعزولة – هو المفتاح للاحتفاظ بالعملاء مع تقليص فجوة القدرات بين النماذج.
ومع ذلك، أصر جيرستنهابر على أن النماذج الأكبر والأفضل – مثل Claude 3.5 Opus – تلوح في الأفق، مع ميزات مثل البحث على الويب والقدرة على تذكر التفضيلات.
“أنا لم أر لقد اصطدم التعلم العميق بالحائط مرة أخرى“، وسأترك الأمر للباحثين للتكهن بشأن الجدار، لكنني أعتقد أنه من المبكر بعض الشيء استخلاص استنتاجات حول هذا الأمر، خاصة بالنظر إلى وتيرة الابتكار”. “هناك تطور وابتكار سريعان للغاية، وليس لدي أي سبب للاعتقاد بأنه سيتباطأ”.
سنرى.
Source link