يقدم موظف علي بابا نظرة ثاقبة حول إنشاء LLM في الصين

Maywiltech28/02/2024

0 17 3 دقائق

تعمل شركات التكنولوجيا الصينية على حشد كل أنواع الموارد والمواهب لتضييق الفجوة بينها وبين OpenAI، ومن الممكن أن تكون تجارب الباحثين على ضفتي المحيط الهادئ متشابهة إلى حد لافت للنظر. تسعى مقالة حديثة إلى مطابقة إمكانيات ChatGPT.

بينيوان هوي، باحث في معالجة اللغات الطبيعية ضمن فريق Qwen الكبير لنماذج اللغات في علي بابا، مشاركة جدوله اليومي على X، يعكس أ وظيفة بقلم الباحث في OpenAI Jason Wei والذي انتشر مؤخرًا.

وتكشف النظرة الموازية ليومهم النموذجي عن أوجه تشابه مذهلة، مع أوقات الاستيقاظ في الساعة 9 صباحًا والذهاب إلى السرير حوالي الساعة 1 صباحًا. يبدأ كلاهما يومهما باجتماعات، تليها فترة من البرمجة والتدريب على النماذج والعصف الذهني مع الزملاء. وحتى بعد عودتهم إلى المنزل، يواصلون إجراء التجارب ليلاً والتفكير في طرق لتحسين نماذجهم حتى وقت النوم.

تكمن الاختلافات الملحوظة في كيفية اختيارهم لتوصيف وقت الفراغ. ذكر هوي، موظف علي بابا، قراءة الأوراق البحثية وتصفح X للبقاء على اطلاع على “ما يحدث في العالم”. وكما أشار أحد المعلقين، لا يتناول هوي كأسًا من النبيذ بمجرد عودته إلى المنزل مثلما يفعل وي.

إن نظام العمل المكثف هذا ليس بالأمر غير المعتاد في مجال ماجستير إدارة الأعمال الحالي في الصين، حيث تنضم المواهب التقنية الحاصلة على درجات أكاديمية عليا إلى شركات التكنولوجيا بأعداد كبيرة لبناء نماذج ذكاء اصطناعي تنافسية.

إلى حد ما، يبدو أن جدول أعمال هوي المتطلب يعكس رغبة شخصية في مجاراة شركات وادي السيليكون في مجال الذكاء الاصطناعي (أو على الأقل الظهور أمام وسائل التواصل الاجتماعي للقيام بذلك)، أو حتى التفوق عليها. هذا يبدو مختلفا عن ساعات العمل الإجبارية “996” المرتبطة بأنواع أكثر “تقليدية” من شركات الإنترنت الصينية التي تنطوي على عمليات ثقيلة، مثل ألعاب الفيديو والتجارة الإلكترونية.

يومي النموذجي كعضو في الجهاز الفني في كوين (فقط بالنسبة لي):
(9:00 صباحًا) استيقظ، قد تبقى في السرير لمدة 15 دقيقة أخرى.
(9:30 صباحًا) استقل سيارة أجرة إلى العمل وتصفح @_jasonwei الرسالة الأخيرة من.
(10:00) العمل… https://t.co/7o47EQrWcW

– بينيوان هوي (@huybery) 21 فبراير 2024

في الواقع، حتى مستثمر الذكاء الاصطناعي الشهير وعالم الكمبيوتر كاي فو لي يبذل جهدًا لا يصدق في هذا الأمر. عندما كنت المحاور Lee حول LLM unicorn 01.AI الجديد في نوفمبر، اعترف بأن ساعات العمل المتأخرة كانت هي القاعدة، لكن الموظفين عملوا بجد بسعادة. في ذلك اليوم، أرسل له أحد أعضاء فريقه رسالة في الساعة 2:15 صباحًا للتعبير عن حماسه لكونه جزءًا من مهمة 01.AI.

تتحدث المظاهر الخارجية لأخلاقيات العمل المكثفة عن مدى إلحاح المهام التي حددتها شركات التكنولوجيا في البلاد، وبالتالي السرعة التي تنشر بها هذه الشركات الآن شهادات LLM.

كوين، على سبيل المثال، لديه مفتوح المصدر سلسلة من النماذج الأساسية المدربة باستخدام البيانات الإنجليزية والصينية. ويبلغ عدد المعلمات – وهو الرقم الذي يتحدث عن المعرفة التي يكتسبها النموذج من بيانات التدريب التاريخية التي تحدد قدرته على توليد استجابات ذات صلة بالسياق – 72 مليارًا لأكبرها. (في بعض السياق، تقدر قيمة GPT3 الخاصة بـ OpenAI بـ 175 مليارًا؛ وتبلغ قيمة GPT4، أحدث LLM، 1.7 تريليون. ومع ذلك، يمكن القول بأن التركيز على LLM معين سيكون المفتاح الأكثر أهمية لفك تشفير قيمة أرقام المعلمات العالية . .)

لم يضيع الفريق أي وقت في تقديم التطبيقات التجارية. في أبريل الماضي، علي بابا بدأ دمج Qwen في منصة الاتصالات التجارية الخاصة بها DingTalk ومتاجر التجزئة عبر الإنترنت Tmall.

حتى الآن، لم يظهر أي زعيم محدد في مجال LLM في الصين، ويقوم أصحاب رؤوس الأموال والمستثمرون من الشركات بتوزيع رهاناتهم على العديد من المنافسين. بالإضافة إلى إنشاء ماجستير إدارة الأعمال الخاص بها، تستثمر علي بابا بقوة في الشركات الناشئة مثل Moonshot AI, منظمة العفو الدولية زيبو, بايتشوان و 01.AI.

في مواجهة المنافسة، تحاول شركة علي بابا إنشاء مكانة لها، وقد يصبح نهجها متعدد اللغات نقطة بيع. في ديسمبر الشركة مطلق سراحه LLM لعدة لغات جنوب شرق آسيا. النموذج المسمى SeaLLM، قادر على معالجة المعلومات باللغات الفيتنامية والإندونيسية والتايلاندية والماليزية والخميرية واللاوسية والتاغالوغية والبورمية. ومن خلال أعمالها في مجال الحوسبة السحابية والاستحواذ على منصة التجارة الإلكترونية Lazada، أنشأت شركة Alibaba حضورًا كبيرًا في المنطقة ويمكنها إدخال SeaLLM في هذه الخدمات في المستقبل.

Source link

Maywiltech28/02/2024

0 17 3 دقائق