إيلون ماسك xAI مطلق سراحه إنها يفهم باستفاضة نموذج لغة كبير في “مفتوح المصدر” في نهاية هذا الأسبوع. ومن الواضح أن الملياردير يأمل في وضع شركته على خلاف مع منافستها OpenAI، والتي على الرغم من اسمها ليست مفتوحة بشكل خاص. ولكن هل يساهم إطلاق التعليمات البرمجية من شيء مثل Grok فعليًا في مجتمع تطوير الذكاء الاصطناعي؟ نعم و لا.
يفهم باستفاضة هو برنامج chatbot تم تدريبه بواسطة xAI للقيام بنفس الدور المحدد بشكل غامض كشيء مثل ChatGPT أو Claude: أنت تسأله، فهو يجيب. ومع ذلك، فقد مُنحت درجة الماجستير في القانون هذه أسلوبًا وقحًا وإمكانية وصول إضافية إلى بيانات تويتر من أجل تمييزها عن الآخرين.
وكما هو الحال دائمًا، يكاد يكون من المستحيل تقييم هذه الأنظمة، ولكن يبدو أن الإجماع العام هو أنها قادرة على المنافسة مع أحدث جيل من النماذج متوسطة الحجم مثل GPT-3.5. (سواء قررت أن هذا أمر مثير للإعجاب نظرًا للإطار الزمني القصير للتطوير أو مخيب للآمال نظرًا للميزانية والضجيج المحيط بـ xAI، فالأمر متروك لك تمامًا.)
بغض النظر، فإن Grok هو برنامج LLM حديث وعملي ذو حجم وإمكانيات كبيرة، وكلما زاد وصول مجتمع المطورين إلى أعماق مثل هذه الأشياء، كان ذلك أفضل. تكمن المشكلة في تعريف كلمة “مفتوح” بطريقة تحقق أكثر من مجرد السماح لشركة (أو ملياردير) بالمطالبة بالأرضية الأخلاقية العالية.
ليست هذه هي المرة الأولى التي يتم فيها التشكيك أو إساءة استخدام مصطلحي “مفتوح” و”مفتوح المصدر” في عالم الذكاء الاصطناعي. ونحن لا نتحدث فقط عن مشكلة فنية، مثل اختيار ترخيص مستخدم غير مفتوح مثل أي ترخيص آخر (Grok هو Apache 2.0، إذا كنت تتساءل).
بالنسبة للمبتدئين، تختلف نماذج الذكاء الاصطناعي عن البرامج الأخرى عندما يتعلق الأمر بجعلها “مفتوحة المصدر”.
إذا قمت بإنشاء معالج نصوص، على سبيل المثال، فمن السهل نسبيًا جعله مفتوح المصدر: حيث تقوم بنشر كل التعليمات البرمجية الخاصة بك علنًا وتسمح للمجتمع باقتراح تحسينات أو إنشاء نسختهم الخاصة. جزء مما يجعل المصدر المفتوح ذا قيمة كمفهوم هو أن كل جانب من جوانب التطبيق أصلي أو منسوب إلى منشئه الأصلي. إن هذه الشفافية واحترام الإسناد الصحيح ليست مجرد نتيجة ثانوية، ولكنها أساسية لمفهوم الانفتاح ذاته.
مع الذكاء الاصطناعي، يمكن القول إن هذا غير ممكن على الإطلاق، لأن الطريقة التي يتم بها إنشاء نماذج التعلم الآلي تنطوي على عملية غير معروفة إلى حد كبير يتم من خلالها استخلاص كمية هائلة من بيانات التدريب وتحويلها إلى تمثيل إحصائي معقد لا يوجهه أي إنسان حقًا، أو حتى يفهمه. . لا يمكن فحص هذه العملية وتدقيقها وتحسينها بنفس طريقة التعليمات البرمجية التقليدية. لذلك، على الرغم من أنها لا تزال تتمتع بقيمة هائلة من ناحية ما، إلا أنه لا يمكن فتحها حقًا. (مجتمع المعايير ليس لديه حتى حدد ما سيكون الافتتاح في هذا السياق، ولكن مناقشته بنشاط.)
ولم يمنع هذا مطوري وشركات الذكاء الاصطناعي من تصميم نماذجهم والمطالبة بها باعتبارها “مفتوحة”، وهو المصطلح الذي فقد الكثير من معناه في هذا السياق. يسمي البعض نموذجهم “مفتوحًا” إذا كانت هناك واجهة عامة أو واجهة برمجة التطبيقات (API). يسميها البعض “مفتوحة” إذا نشروا مقالاً يصف عملية التطوير.
ربما يكون أقرب نموذج للذكاء الاصطناعي إلى “المصدر المفتوح” هو عندما ينشر مطوروه أفكارهم الوزن، أي السمات الدقيقة للعقد التي لا تعد ولا تحصى من شبكاتها العصبية، والتي تنفذ عمليات رياضية متجهة بترتيب دقيق لإكمال النموذج الذي بدأه إدخال المستخدم. ولكن حتى النماذج “مفتوحة الوزن” مثل LLaMa-2 تستبعد بيانات مهمة أخرى، مثل مجموعة البيانات وعملية التدريب، التي قد تكون ضرورية لإعادة إنشائها من الصفر. (بعض المشاريع تذهب إلى أبعد من ذلكطبعا.)
كل هذا دون الإشارة إلى حقيقة أن الأمر يتطلب ملايين الدولارات من موارد الحوسبة والهندسة لإنشاء أو إعادة إنتاج هذه النماذج، مما يحد فعليًا من أولئك الذين يمكنهم إنشاءها وإعادة إنتاجها من الشركات التي تتمتع بموارد كبيرة.
إذن، أين تقع نسخة Grok من xAI في هذا الطيف؟
كنموذج مفتوح الوزن، فهو جاهز للاستخدام من قبل أي شخص. التنزيل أو الاستخدام أو التعديل أو التعديل أو التقطير. إنه جيد! ويبدو أنه أحد أكبر النماذج التي يمكن لأي شخص الوصول إليها بحرية بهذه الطريقة، من حيث المعلمات – 314 مليارًا – مما يمنح المهندسين الفضوليين مجالًا واسعًا للعمل إذا أرادوا اختبار كيفية عمله بعد تعديلات مختلفة.
ومع ذلك، هناك جوانب سلبية خطيرة لحجم النموذج: ستحتاج إلى مئات الجيجابايت من ذاكرة الوصول العشوائي عالية السرعة لاستخدامه بهذا الشكل الأولي. إذا لم تكن تمتلك بالفعل، على سبيل المثال، عشرات من أجهزة Nvidia H100 في جهاز استدلال يعمل بالذكاء الاصطناعي مكون من ستة أرقام، فلا تكلف نفسك عناء النقر فوق رابط التنزيل هذا.
وعلى الرغم من أن Grok يمكن القول إنها قادرة على المنافسة مع بعض النماذج الحديثة الأخرى، إلا أنها أكبر منها بكثير، مما يعني أنها تتطلب المزيد من الموارد لإنجاز نفس الشيء. لا يزال هناك تسلسل هرمي للحجم والكفاءة والمعلمات الأخرى، ولا يزال ذلك ذا قيمة، ولكنه يتعلق بالمادة الخام أكثر من المنتج النهائي. من غير الواضح أيضًا ما إذا كان هذا هو الإصدار الأحدث والأفضل من Grok، مثل الإصدار المحسن بشكل واضح والذي يمكن للبعض الوصول إليه من خلال X.
بشكل عام، يعد نشر هذه البيانات أمرًا جيدًا، لكنه لا يغير قواعد اللعبة كما كان يأمل البعض.
ومن الصعب أيضًا ألا نتساءل لماذا يفعل ماسك ذلك. هل شركته الناشئة في مجال الذكاء الاصطناعي ملتزمة حقًا بتطوير المصادر المفتوحة؟ أم أن الأمر مجرد طين في عيون شركة OpenAI التي يعمل بها ” ماسك ” حاليًا مطاردة لحم البقر مستوى الملياردير؟
إذا كانوا ملتزمين حقًا بتطوير المصادر المفتوحة، فسيكون هذا هو الأول من بين الكثير ونأمل أن يأخذوا تعليقات المجتمع وينشروا معلومات مهمة أخرى ويميزوا عملية التدريب على البيانات وسيشرحون نهجهم بشكل أكبر. إذا لم يكن الأمر كذلك، ويتم ذلك فقط حتى يتمكن ” ماسك ” من الإشارة إليه في الحجج عبر الإنترنت، فسيظل ذا قيمة – لكنه ليس شيئًا من المقرر أن يدعمه أي شخص في عالم الذكاء الاصطناعي أو يوليه الكثير من الاهتمام بعد ذلك. الأشهر القليلة المقبلة اللعب معها. الموديل.
Source link