تشفير

أنفقت شركة Databricks 10 ملايين دولار على نموذج الذكاء الاصطناعي التوليدي الجديد DBRX، لكنها لا تستطيع التغلب على GPT-4

إذا كنت ترغب في رفع مستوى شركة التكنولوجيا الكبيرة لديك وكان لديك 10 ملايين دولار لإنفاقها، فكيف ستنفقها؟ في إعلان تجاري لـ Super Bowl؟ رعاية F1؟

أنت استطاع أنفقها في تدريب نموذج الذكاء الاصطناعي التوليدي. على الرغم من أنها ليست تسويقًا بالمعنى التقليدي، إلا أن النماذج التوليدية تجتذب الاهتمام بشكل متزايد وتوجه نحو المنتجات والخدمات الأساسية للموردين.

راجع DBRX من Databricks، وهو نموذج جديد للذكاء الاصطناعي تم الإعلان عنه اليوم مشابه لـ سلسلة OpenAI GPT و جوجل الجوزاء. متاحة على GitHub ومنصة تطوير Hugging Face AI للبحث وكذلك الاستخدام التجاري، يمكن تشغيل الإصدارات الأساسية (DBRX Base) والمكررة (DBRX Instruct) من DBRX وتحسينها على البيانات العامة، سواء كانت مخصصة أو مملوكة بأي شكل آخر.

قال نافين راو، نائب رئيس الذكاء الاصطناعي التوليدي في Databricks، في مقابلة مع TechCrunch: “تم تدريب DBRX ليكون مفيدًا ويقدم رؤى حول مجموعة واسعة من المواضيع”. “تم تحسين DBRX وضبطه لاستخدام اللغة الإنجليزية، ولكنه قادر على التحدث والترجمة إلى مجموعة واسعة من اللغات، مثل الفرنسية والإسبانية والألمانية.”

تصف Databricks DBRX بأنه “مفتوح المصدر” بنفس الطريقة مثل النماذج “مفتوحة المصدر” مثل Meta’s. اللاما 2 وشركة ميسترال الناشئة للذكاء الاصطناعي عارضات ازياء. (هذا هو الموضوع قوي مناظرة حول ما إذا كانت هذه النماذج تلبي بالفعل تعريف المصدر المفتوح.)

تدعي شركة Databricks أنها أنفقت ما يقرب من 10 ملايين دولار وثمانية أشهر لتدريب DBRX، والذي تقول (نقلاً عن بيان صحفي) “يتفوق في الأداء على جميع النماذج مفتوحة المصدر الموجودة وفقًا للمعايير القياسية.”

ولكن – وهذا هو الأمر التسويقي – من الصعب للغاية استخدام DBRX إلا ​​إذا كنت أحد عملاء Databricks.

في الواقع، لتشغيل DBRX في التكوين القياسي، تحتاج إلى خادم أو كمبيوتر شخصي مزود بأربع وحدات معالجة رسوميات Nvidia H100 على الأقل. تبلغ تكلفة H100 الواحدة آلاف الدولارات أو أكثر. قد يكون هذا بمثابة مبلغ بسيط من المال بالنسبة للشركات المتوسطة، ولكن بالنسبة للعديد من المطورين ورجال الأعمال الأفراد، فهو بعيد المنال.

وهناك طباعة جيدة للتمهيد. تقول Databricks أن الشركات التي تضم أكثر من 700 مليون مستخدم نشط ستواجه “بعض القيود” قابلة للمقارنة إلى Meta’s for Llama 2، وأنه سيتعين على جميع المستخدمين الموافقة على الشروط التي تضمن استخدامهم لـ DBRX “بشكل مسؤول”. (لم تكشف Databricks عن تفاصيل هذه الشروط في وقت النشر.)

تروج شركة Databricks لمنتج Mosaic AI Foundation Model الخاص بها باعتباره الحل المُدار لهذه العقبات، والذي، بالإضافة إلى تشغيل DBRX والنماذج الأخرى، يوفر حزمة تدريب لضبط DBRX على البيانات المخصصة. يمكن للعملاء استضافة DBRX بشكل خاص باستخدام عرض تقديم نموذج Databricks، كما اقترح Rao، أو يمكنهم العمل مع Databricks لنشر DBRX على الأجهزة التي يختارونها.

وأضاف راو:

نحن نسعى جاهدين لجعل منصة Databricks الخيار الأفضل لإنشاء نماذج مخصصة. لذا فإن فائدة Databricks في نهاية المطاف هي وجود عدد أكبر من المستخدمين على منصتنا. يعد DBRX بمثابة عرض توضيحي لمنصة التدريب المسبق والضبط الأفضل في فئتها، والتي يمكن للعملاء استخدامها لبناء نماذجهم الخاصة من الصفر. هذه طريقة سهلة للعملاء لبدء استخدام أدوات الذكاء الاصطناعي التوليدية Databricks Mosaic AI. ويتميز DBRX بأداء عالٍ خارج الصندوق ويمكن ضبطه للحصول على أداء ممتاز في مهام محددة بتكلفة اقتصادية أكثر من النماذج المغلقة الكبيرة.

تدعي Databricks أن DBRX يعمل بشكل أسرع بما يصل إلى 2x من Llama 2، ويرجع الفضل في ذلك جزئيًا إلى بنيته المتخصصة المختلطة (MoE). MoE – التي تشاركها DBRX مع Llama 2، أحدث موديلات ميسترال والتي أعلنت عنها Google مؤخرًا الجوزاء 1.5 برو – يقوم بشكل أساسي بتقسيم مهام معالجة البيانات إلى مهام فرعية متعددة، ثم تفويض هذه المهام الفرعية إلى نماذج “خبراء” أصغر ومتخصصة.

تضم معظم نماذج وزارة التربية والتعليم ثمانية خبراء. لدى DBRX 16، والتي تقول Databricks إنها تعمل على تحسين الجودة.

ومع ذلك، الجودة نسبية.

بينما تدعي Databricks أن DBRX يتفوق على Llama 2 وMistral في بعض اختبارات فهم اللغة والبرمجة والرياضيات والمنطق، يمكن القول إن DBRX لا يرقى إلى مستوى نموذج الذكاء الاصطناعي التوليدي الرائد، GPT-4 d ‘OpenAI، في معظم المجالات خارج حالات الاستخدام المتخصصة مثل برمجة قاعدة البيانات. جيل اللغة.

يعترف راو بأن DBRX لديه أيضًا قيود أخرى، وهي أنه، مثل جميع نماذج الذكاء الاصطناعي التوليدي الأخرى، يمكن أن يقع ضحية “العصف الذهني» يستجيب للاستفسارات على الرغم من اختبار أمان Databricks وعمل الفريق الأحمر. نظرًا لأنه تم تدريب النموذج ببساطة على ربط الكلمات أو العبارات بمفاهيم معينة، إذا لم تكن هذه الارتباطات دقيقة تمامًا، فلن تكون استجاباته دقيقة دائمًا.

بالإضافة إلى ذلك، DBRX ليس متعدد الوسائط، على عكس بعض نماذج الذكاء الاصطناعي التوليدية الرائدة الأحدث، بما في ذلك Gemini. (يمكنه معالجة وإنشاء النصوص فقط، وليس الصور.) ولا نعرف بالضبط ما هي مصادر البيانات التي تم استخدامها لتدريبه؛ سيكشف راو فقط أنه لم يتم استخدام أي بيانات لعملاء Databricks في تدريب DBRX.

وأضاف: “لقد قمنا بتدريب DBRX على مجموعة كبيرة من البيانات من مجموعة واسعة من المصادر”. “لقد استخدمنا مجموعات البيانات المفتوحة التي يعرفها المجتمع ويحبها ويستخدمها كل يوم. »

سألت راو عما إذا كانت أي من مجموعات بيانات تدريب DBRX محمية بحقوق الطبع والنشر أو مرخصة، أو أظهرت علامات واضحة على التحيز (على سبيل المثال. التحيز العنصري)، لكنه لم يرد بشكل مباشر، واكتفى بالقول: «لقد انتبهنا إلى البيانات المستخدمة وأجرينا تمارين الفريق الأحمر لتحسين نقاط الضعف في النموذج. » تميل نماذج الذكاء الاصطناعي التوليدية إلى ذلك اجتر تمثل بيانات التدريب مصدر قلق كبير للمستخدمين التجاريين للنماذج المدربة على بيانات غير مرخصة أو محمية بحقوق الطبع والنشر أو متحيزة بشكل واضح للغاية. في أسوأ السيناريوهات، يمكن أن يجد المستخدم نفسه يواجه مشكلات أخلاقية وقانونية بسبب دمج عمل مخالف أو متحيز من نموذج ما في مشاريعه عن غير قصد.

تقدم بعض الشركات التي تقوم بتدريب ونشر نماذج الذكاء الاصطناعي التوليدية سياسات تغطي التكاليف القانونية الناتجة عن الانتهاكات المحتملة. لا تقوم شركة Databricks بذلك في الوقت الحالي، ويقول راو إن الشركة “تستكشف السيناريوهات” التي يمكنها من خلالها القيام بذلك.

وبالنظر إلى هذا والمجالات الأخرى التي تفتقد فيها DBRX العلامة، يبدو أن النموذج يصعب بيعه لأي شخص باستثناء عملاء Databricks الحاليين أو المحتملين. يقدم منافسو Databricks في مجال الذكاء الاصطناعي التوليدي، بما في ذلك OpenAI، تقنيات مقنعة بنفس القدر، إن لم يكن أكثر، بأسعار تنافسية للغاية. والعديد من نماذج الذكاء الاصطناعي التوليدية تقترب من التعريف الشائع للمصدر المفتوح أكثر من DBRX.

يعد Rao بأن Databricks ستستمر في تحسين DBRX وإصدار إصدارات جديدة حيث يقوم فريق البحث والتطوير التابع لشركة Mosaic Labs – الفريق الذي يقف وراء DBRX – بالبحث في طرق جديدة للذكاء الاصطناعي التوليدي.

وقال: “تعمل DBRX على تطوير مساحة النماذج مفتوحة المصدر وتتحدى النماذج المستقبلية ليتم بناؤها بشكل أكثر كفاءة”. “سنصدر متغيرات بينما نطبق تقنيات لتحسين جودة الإنتاج من حيث الموثوقية والأمان والتحيز… نحن ننظر إلى النموذج المفتوح كمنصة يمكن لعملائنا من خلالها إنشاء إمكانات مخصصة باستخدام أدواتنا. »

وبالحكم على مكانة DBRX حاليًا مقارنة بأقرانها، فإن الطريق أمامها طويل بشكل استثنائي.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى