كشفت وثائق المحكمة أن المسؤولين التنفيذيين في Meta مهووسون بهزيمة GPT-4 الخاص بـ OpenAI داخليًا

Maywiltechمنذ 3 أسابيع

0 0 2 دقائق

كان المسؤولون التنفيذيون والباحثون الذين يقودون جهود الذكاء الاصطناعي في Meta مهووسين بالتغلب على نموذج GPT-4 الخاص بـ OpenAI أثناء تطوير Llama 3، وفقًا لـ رسائل داخلية كشفت عنها المحكمة يوم الثلاثاء في إحدى قضايا حقوق النشر الخاصة بالذكاء الاصطناعي المستمرة للشركة، Kadrey v. ميتا.

قال أحمد الدحلة، نائب رئيس Meta للذكاء الاصطناعي التوليدي، في رسالة بتاريخ أكتوبر 2023 إلى باحث Meta هوغو توفرون: “بصراحة… يجب أن يكون هدفنا هو GPT-4”. “لدينا 64000 وحدة معالجة رسوميات قادمة!” يجب أن نتعلم كيفية بناء الحدود والفوز بهذا السباق.

على الرغم من أن Meta تنشر نماذج الذكاء الاصطناعي المفتوحة، إلا أن قادة الذكاء الاصطناعي في الشركة كانوا أكثر تركيزًا على التغلب على المنافسين الذين لا ينشرون عادةً أوزان نماذجهم، مثل Anthropic وOpenAI، ويضعون بدلاً من ذلك خلف واجهة برمجة التطبيقات. نظر المسؤولون التنفيذيون والباحثون في شركة Meta إلى Claude من Anthropic وGPT-4 من OpenAI كمعيار للعمل.

تم ذكر شركة ميسترال الفرنسية الناشئة للذكاء الاصطناعي، وهي واحدة من أكبر المنافسين المفتوحين لشركة ميتا، عدة مرات في الرسائل الداخلية، لكن اللهجة كانت رافضة.

وقال الدحلة في رسالة: “الميسترال مجرد حبة فول سوداني بالنسبة لنا”. وقال في وقت لاحق: “يجب أن نكون قادرين على القيام بعمل أفضل”.

في هذه الأيام، تتسابق شركات التكنولوجيا للتفوق على بعضها البعض من خلال نماذج الذكاء الاصطناعي المتطورة، لكن ملفات المحكمة هذه تكشف مدى المنافسة – وعلى ما يبدو دائما كذلك. في عدة نقاط من تبادل الرسائل، أوضح قادة الذكاء الاصطناعي في Meta كيف كانوا “عدوانيين للغاية” في الحصول على البيانات الصحيحة لتدريب اللاما؛ وفي مرحلة ما، قال أحد المسؤولين التنفيذيين في رسالة إلى زملائه إن “Llama 3 هو كل ما أهتم به حرفيًا”.

يزعم ممثلو الادعاء في هذه القضية أن المديرين التنفيذيين لشركة ميتا في بعض الأحيان يختصرون الطريق في اندفاعهم المجنون لشحن نماذج الذكاء الاصطناعي، أثناء التدريب على الكتب المحمية بحقوق الطبع والنشر.

أشار توفرون في منشور إلى أن مجموعة مجموعات البيانات المستخدمة في Llama 2 “كانت سيئة” وأوضح كيف يمكن لـ Meta استخدام مجموعة أفضل من مصادر البيانات لتحسين Llama 3. ثم تحدث توفيرون والدحل عن فتح الطريق أمام استخدم مجموعة بيانات LibGen، التي تحتوي على أعمال محمية بحقوق الطبع والنشر من Cengage Learning وMacmillan Learning وMcGraw Hill وPearson Education.

قال الدحل: “هل لدينا مجموعات البيانات الصحيحة هناك (؟)”. “هل هناك شيء تريد استخدامه ولكنك لا تستطيع استخدامه لسبب غبي؟” »

قال الرئيس التنفيذي لشركة Meta Mark Zuckerberg سابقًا إنه يحاول سد فجوة الأداء بين نماذج الذكاء الاصطناعي الخاصة بـ Llama والنماذج المغلقة من OpenAI وGoogle وغيرها. تكشف الرسائل الداخلية عن الضغط الشديد داخل الشركة للقيام بذلك.

وقال زوكربيرج في بيان: “هذا العام، ينافس Llama 3 الطرازات الأكثر تقدمًا ويتصدر في بعض المجالات”. خطاب اعتبارًا من يوليو 2024. “بدءًا من العام المقبل، نتوقع أن تصبح نماذج اللاما المستقبلية هي الأكثر تقدمًا في الصناعة. »

عندما ميتا أخيرا تم إصدار Llama 3 في أبريل 2024كان نموذج الذكاء الاصطناعي المفتوح منافسًا للنماذج المغلقة الرائدة من جوجل، وOpenAI، وAnthropic، وتفوق على خيارات ميسترال المفتوحة. ومع ذلك، فإن البيانات التي تستخدمها ميتا لتدريب نماذجها – البيانات التي يُقال إن زوكربيرج أعطى الضوء الأخضر لاستخدامها، على الرغم من حقوق الطبع والنشر الخاصة بها – تخضع للتدقيق في العديد من الدعاوى القضائية الجارية.

Source link

Maywiltechمنذ 3 أسابيع

0 0 2 دقائق