شركة الذكاء الاصطناعي الناشئة Anthropic، بدعم من مئات الملايين في رأس المال الاستثماري (وربما قريبا مئات الملايين آخرين)، اليوم إعلان أحدث نسخة من تكنولوجيا GenAI، كلود. وتقول الشركة إنها تنافس شركة OpenAI. جي بي تي-4 من حيث الأداء.
Claude 3، كما يُطلق على GenAI الجديد لشركة Anthropic، هي عائلة من العارضات: Claude 3 Haiku، وClaude 3 Sonnet، وClaude 3 Opus، مع كون Opus الأقوى. تُظهر جميعها “قدرات متزايدة” في التحليل والتنبؤ، والادعاءات الإنسانية، فضلاً عن تحسين الأداء في معايير محددة مقارنة بنماذج مثل GPT-4 (ولكن ليس جي بي تي-4 توربو) وذلك من جوجل الجوزاء 1.0 الترا (لكن لا الجوزاء 1.5 برو).
والجدير بالذكر أن Claude 3 هو أول GenAI متعدد الوسائط من Anthropic، مما يعني أنه يمكنه تحليل النص وكذلك الصور – مثل بعض النكهات جي بي تي-4 و تَوأَم. يستطيع Claude 3 معالجة الصور والجداول والرسوم البيانية والرسومات الفنية، والرسم من ملفات PDF وعروض الشرائح وأنواع أخرى من المستندات.
أفضل من بعض منافسي GenAI، يستطيع Claude 3 تحليل صور متعددة في طلب واحد (بحد أقصى 20). وهذا يسمح لها بمقارنة الصور وتباينها، كما يشير الأنثروبي.
لكن هناك حدودًا لمعالجة صور كلود 3.
منعت النماذج الإنسانية من تحديد هوية الأشخاص ــ خوفا من العواقب الأخلاقية والقانونية. وتعترف الشركة بأن كلود 3 عرضة لارتكاب أخطاء مع الصور “رديئة الجودة” (أقل من 200 بكسل) ويواجه صعوبة في أداء المهام التي تنطوي على التفكير المكاني (مثل قراءة تناظرية وجه الساعة) وعد الأشياء (لا يستطيع كلود 3 تقديم بيانات دقيقة). ). عدد الكائنات في الصور).
كلود 3 لن يفعل ذلك أيضًا يولد عمل فني. تقوم النماذج بتحليل الصور بدقة، على الأقل في الوقت الحالي.
سواء كانت نصًا أو صورًا، تقول Anthropic أن العملاء يمكنهم عمومًا أن يتوقعوا من Claude 3 اتباع التعليمات متعددة الخطوات بشكل أفضل، وإنتاج مخرجات منظمة بتنسيقات مثل JSON والتحدث بلغات غير الإنجليزية مقارنة بسابقاتها. يجب على كلود 3 أيضًا أن يرفض الإجابة على الأسئلة بشكل أقل، وذلك بفضل “الفهم الدقيق للطلبات”، كما تعتقد أنثروبيك. وقريباً سيذكر كلود 3 مصدر إجاباته على الأسئلة حتى يتمكن المستخدمون من التحقق منها.
“يميل كلود 3 إلى توليد استجابات أكثر تعبيراً وجاذبية”، كتب أنثروبيك في مقالة دعم. “(إنها) أسهل في التوجيه والتوجيه مقارنة بنماذجنا القديمة. يجب أن يجد المستخدمون أنه يمكنهم تحقيق النتائج المرجوة من خلال مطالبات أقصر وأكثر إيجازًا.
بعض هذه التحسينات تأتي من السياق الأوسع لكلوديوس 3.
يشير سياق النموذج، أو النافذة المنبثقة، إلى بيانات الإدخال (مثل النص) التي يأخذها النموذج في الاعتبار قبل إنشاء المخرجات. تميل النماذج ذات النوافذ المنبثقة الصغيرة إلى “نسيان” محتوى المحادثات الحديثة جدًا، مما يؤدي إلى خروجها عن الموضوع – غالبًا بطرق إشكالية. وكميزة إضافية، يمكن لنماذج السياق الواسع أن تلتقط بشكل أفضل التدفق السردي للبيانات التي تدمجها وتولد استجابات أكثر ثراءً من حيث السياق (على الأقل من الناحية النظرية).
تقول Anthropic أن Claude 3 سيدعم في البداية نافذة منبثقة مكونة من 200000 رمز، أي ما يعادل 150000 كلمة تقريبًا، مع استفادة عملاء محددين من مليون رمز منبثق (حوالي 700000 كلمة). وهذا مشابه لأحدث طراز GenAI من Google، Gemini 1.5 Pro المذكور أعلاه، والذي يوفر أيضًا نافذة منبثقة تصل إلى مليون رمز مميز.
الآن، لمجرد أن Claude 3 عبارة عن ترقية لما جاء قبله، فهذا لا يعني أنه مثالي.
في المجال الفني ورق ابيضتعترف الأنثروبيك بأن كلود 3 ليس محصنًا ضد المشكلات التي تعاني منها نماذج GenAI الأخرى، وهي التحيز والتحيز الهلوسة (أي صنع الأشياء). على عكس بعض نماذج GenAI، لا يستطيع كلود 3 البحث في الويب؛ لا يمكن للنماذج الإجابة على الأسئلة إلا باستخدام بيانات تعود إلى ما قبل أغسطس 2023. وعلى الرغم من أن كلود متعدد اللغات، إلا أنه لا يجيد بعض اللغات “منخفضة الموارد” مثل اللغة الإنجليزية.
لكن Anthropic تعد بتحديثات متكررة لـ Claude 3 في الأشهر المقبلة.
وكتبت الشركة في بيان: “لا نعتقد أن ذكاء النماذج يقترب من حدوده، ونخطط لإطلاق (تحسينات) لعائلة نماذج كلود 3 في الأشهر المقبلة”. مشاركة مدونة.
Opus وSonnet متاحان الآن على الويب ومن خلال وحدة تحكم مطوري Anthropic وAmazon API. حجر الأساس منصة وجوجل قمة الذكاء الاصطناعي. وسوف يتبع الهايكو في وقت لاحق من هذا العام.
وهنا توزيع الأسعار:
- Opus: 15 دولارًا لكل مليون رمز إدخال، و75 دولارًا لكل مليون رمز إخراج
- Sonnet: 3 دولارات لكل مليون رمز إدخال، و15 دولارًا لكل مليون رمز إخراج
- هايكو: 0.25 دولار لكل مليون رمز إدخال، و1.25 دولار لكل مليون رمز إخراج
إذن، لدينا كلود 3. لكن ما هو المنظر من ارتفاع 30 ألف قدم لكل هذا؟
حسنا كما لدينا ذكرت في السابق، كان طموح Anthropic هو إنشاء خوارزمية من الجيل التالي لـ “الذكاء الاصطناعي للتعلم الذاتي”. يمكن استخدام مثل هذه الخوارزمية لإنشاء مساعدين افتراضيين يمكنهم الرد على رسائل البريد الإلكتروني وإجراء عمليات البحث وإنشاء أعمال فنية وكتب وغير ذلك الكثير – وقد جربنا بعضًا منها بالفعل مع شركات مثل جي بي تي-4 وغيرها من نماذج اللغات الرئيسية.
تلمح Anthropic إلى ذلك في منشور المدونة المذكور أعلاه، قائلة إنها تخطط لإضافة ميزات إلى Claude 3 تعزز قدراتها الفورية من خلال السماح لـ Claude بالتفاعل مع الأنظمة الأخرى، والبرمجة “بشكل تفاعلي” وتوفير “قدرات وكيلة متقدمة”. “.
يشير هذا العنصر الأخير إلى عنصر OpenAI ذكرت يهدف إلى إنشاء وكيل برمجي لأتمتة المهام المعقدة، مثل نقل البيانات من مستند إلى جدول بيانات أو ملء تقارير النفقات تلقائيًا وإدخالها في برامج المحاسبة. OpenAI بالفعل عروض واجهة برمجة تطبيقات تسمح للمطورين بإنشاء “تجارب تشبه الوكيل” في تطبيقاتهم، ويبدو أن Anthropic تعتزم توفير وظائف قابلة للمقارنة.
هل يمكننا أن نرى بعد ذلك مولد صور من Anthropic؟ بصراحة، ذلك سيفاجئني. تعد مولدات الصور موضوعًا للكثير من الجدل اليوم، وذلك لأسباب تتعلق أساسًا بحقوق الطبع والنشر والتحيز. اضطرت جوجل مؤخرًا إلى ذلك إبطال منشئ الصور الخاص به بعد إدخال التنوع في الصور مع تجاهل مثير للسخرية للسياق التاريخي. ويوجد عدد من موفري خدمات إنشاء الصور معارك قانونية حيث يتهمهم الفنانون بالتربح من عملهم من خلال تدريب GenAI على هذا العمل دون تقديم تعويض أو حتى ائتمان.
أشعر بالفضول لمعرفة كيف تتطور تقنية Anthropic لتدريب GenAI.”الذكاء الاصطناعي الدستوري“، والذي تقول الشركة إنه يجعل سلوك GenAI الخاص بها أسهل في الفهم، وأكثر قابلية للتنبؤ به، وأسهل في التعديل حسب الحاجة. ويهدف الذكاء الاصطناعي الدستوري إلى توفير طريقة لـ مواءمة الذكاء الاصطناعي مع نوايا الإنسان، اطلب من النماذج الإجابة على الأسئلة وإكمال المهام باستخدام مجموعة بسيطة من المبادئ التوجيهية. على سبيل المثال، بالنسبة لكلود 3، قالت أنثروبيك إنها أضافت مبدأ – مستنيرًا بتعليقات التعهيد الجماعي – يطلب من النماذج أن تكون متفهمة ويمكن للأشخاص ذوي الإعاقة الوصول إليها.
مهما كانت نهاية لعبة الأنثروبيك، فهي موجودة على المدى الطويل. بحسب وفقًا لعرض تم تسريبه في مايو من العام الماضي، تهدف الشركة إلى جمع ما يصل إلى 5 مليارات دولار على مدار الـ 12 شهرًا القادمة أو نحو ذلك – وهو ما قد يكون خط الأساس الذي تحتاجه للبقاء في المنافسة مع OpenAI. (نماذج التدريب ليست رخيصة على أية حال.) ويجري تنفيذ المشروع على قدم وساق، برأس مال ملتزم به يبلغ 2 مليار دولار و4 مليارات دولار من رأس المال الملتزم به وتعهدات من جوجل وأمازون، على التوالي، وأكثر من ذلك بكثير مليار دولار من داعمين آخرين.
Source link