منح مارك زوكربيرج الإذن لفريق Llama التابع لـ Meta بالتدريب على الأعمال المحمية بحقوق الطبع والنشر ومطالبات الملفات
يزعم محامو المدعين في دعوى حقوق الطبع والنشر المرفوعة ضد شركة Meta أن الرئيس التنفيذي لشركة Meta Mark Zuckerberg أعطى الضوء الأخضر للفريق الذي يقف وراء مشروع الشركة. نماذج اللاما AI لاستخدام مجموعة بيانات من الكتب والمقالات الإلكترونية المقرصنة لأغراض التدريب.
تعد قضية Kadrey v. Meta واحدة من عدة قضايا ضد عمالقة التكنولوجيا الذين يقومون بتطوير الذكاء الاصطناعي والذين يتهمون الشركات بتدريب النماذج على الأعمال المحمية بحقوق الطبع والنشر دون إذن. بالنسبة للجزء الأكبر، جادل المدعى عليهم مثل ميتا بأنهم محميون بموجب الاستخدام العادل، وهو المبدأ القانوني الأمريكي الذي يسمح باستخدام الأعمال المحمية بحقوق الطبع والنشر لإنشاء شيء جديد بشرط أن يكون تحويليًا بما فيه الكفاية. يرفض العديد من المبدعين هذه الحجة.
في وثائق غير منقحة حديثا قدم في المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا مساء الأربعاء، روى المدعون في قضية كادري ضد ميتا، ومن بينهم المؤلفتان الأكثر مبيعًا سارة سيلفرمان وتا-نيهيسي كوتس، شهادة ميتا من أواخر العام الماضي، والتي تم خلالها الكشف عن أن زوكربيرج كان تمت الموافقة على مشروع ميتا. باستخدام مجموعة بيانات تسمى LibGen للتدريب المتعلق باللاما.
توفر LibGen، التي تصف نفسها بأنها “مجمع الروابط”، إمكانية الوصول إلى الأعمال المحمية بحقوق الطبع والنشر من ناشرين مثل Cengage Learning وMacmillan Learning وMcGraw Hill وPearson Education. تمت مقاضاة شركة LibGen مرارًا وتكرارًا، وتم إيقافها عن العمل، وتم تغريمها عشرات الملايين من الدولارات بسبب انتهاك حقوق الطبع والنشر.
وفقًا لشهادة Meta، التي نقلها محامي المدعين، سمح زوكربيرج باستخدام LibGen لتدريب واحد على الأقل من نماذج Meta’s Llama، على الرغم من المخاوف داخل فريق قيادة Meta’s AI وأعضاء آخرين في الشركة. يستشهد الملف بموظفي Meta الذين يشيرون إلى LibGen على أنها “مجموعة بيانات نعلم أنه يتم اختراقها” ويحذرون من أن استخدامها “قد يقوض موقف (Meta) التفاوضي مع المنظمين”.
يستشهد الملف أيضًا بمذكرة إلى صانعي القرار في Meta AI تشير إلى أنه بعد “الإرسال إلى MZ”، تم السماح لفريق Meta’s AI باستخدام LibGen. (MZ هنا هو اختصار واضح إلى حد ما لـ “Mark Zuckerberg”.)
ويبدو أن التفاصيل تتطابق مع تقارير صحيفة نيويورك تايمز الصادرة في أبريل الماضي. الذي اقترح أن تقوم شركة Meta بتقليص الأمور لجمع البيانات من أجل الذكاء الاصطناعي الخاص بها. في مرحلة ما، كانت شركة ميتا تقوم بتعيين مقاولين في أفريقيا لتغليف ملخصات الكتب وفكرت في شراء دار نشر سايمون آند شوستر، وفقًا لصحيفة التايمز. لكن المسؤولين التنفيذيين في الشركة شعروا أن التفاوض بشأن التراخيص سيستغرق وقتًا طويلاً للغاية، واعتقدوا أن الاستخدام العادل يمثل دفاعًا قويًا.
يحتوي ملف الأربعاء على اتهامات جديدة، مثل محاولة Meta التستر على انتهاكها المزعوم من خلال قمع إسناد بيانات LibGen.
وبحسب محامي المدعين، فإن المهندس ميتا نيكولاي باشليكوف، الذي يعمل في فريق أبحاث اللاما، كتب نصًا لإزالة معلومات حقوق الطبع والنشر، بما في ذلك كلمة “حقوق النشر” و”شكرًا”، الكتب الإلكترونية في LibGen. بالإضافة إلى ذلك، يقال إن Meta أزالت علامات حقوق الطبع والنشر من مقالات المجلات العلمية و”البيانات الوصفية المصدرية” في بيانات التدريب المستخدمة في Llama.
“تشير هذه النتيجة إلى أن Meta تحذف (معلومات حقوق الطبع والنشر) ليس فقط لأغراض التدريب،” كما جاء في الملف، “ولكن أيضًا لإخفاء انتهاكها لحقوق الطبع والنشر، لأن حذف الأعمال المحمية بموجب حقوق الطبع والنشر… يمنع Llama من إنتاج معلومات حقوق الطبع والنشر التي يمكن أن تنبيه مستخدمي Llama والجمهور إلى انتهاك Meta.
وفقًا لأحدث الملفات، كشف ميتا أيضًا أثناء إفاداته أنه قام باستخدام تورنت LibGen، وهي خطوة جعلت بعض مهندسي أبحاث ميتا يتوقفون. يتطلب التورنت، وهو وسيلة لتوزيع الملفات عبر الويب، من القائمين على التورنت “التمهيد” أو تنزيل الملفات التي يحاولون الحصول عليها في نفس الوقت.
يزعم محامي المدعين أن Meta انخرطت بشكل فعال في شكل آخر من أشكال انتهاك حقوق الطبع والنشر عن طريق تورنت LibGen وبالتالي المساعدة في توزيع محتواها. كما حاولت شركة Meta أيضًا إخفاء أنشطتها، كما يزعم المحامي، من خلال تقليل عدد الملفات التي تم تنزيلها.
وفقًا للملف، فإن رئيس الذكاء الاصطناعي التوليدي في Meta، أحمد الدحلة، “مهد الطريق” لأنشطة التورنت الخاصة بـ LibGen – رافضًا تحفظات باشليكوف بأنها “قد تكون غير مقبولة من الناحية القانونية”.
وكتب محامي المدعين في الدعوى: “إذا اشترت ميتا أعمال المدعين من محل لبيع الكتب أو استعارتها من مكتبة وقامت بتدريب نماذج اللاما الخاصة بها دون ترخيص، لكانت قد ارتكبت انتهاكًا لحقوق الطبع والنشر”. “إن قرار شركة ميتا بالتحايل على الأساليب القانونية للحصول على الكتب وتصبح مشاركًا مطلعًا في شبكة تورنت غير قانونية… يعد بمثابة دليل على انتهاك حقوق الطبع والنشر.”
القضية المرفوعة ضد ميتا لم تتم تسويتها بعد. في الوقت الحالي، يتعلق هذا فقط بنماذج Llama المبكرة من Meta، وليس الإصدارات الأخيرة. وقد تحكم المحكمة لصالح شركة ميتا إذا اقتنعت بحجة الاستخدام العادل للشركة. (في عام 2023، محكمة مرفوض العديد من دعاوى حقوق الطبع والنشر المتعلقة بالذكاء الاصطناعي ضد شركة Meta، ووجدت أن المدعين فشلوا في إثبات حدوث الانتهاك.)
لكن هذه الادعاءات لا تنعكس بشكل جيد على ميتا، كما أشار القاضي الذي يرأس القضية، القاضي فينس تشابريا، في أمر صدر يوم الأربعاء يرفض طلب ميتا بتنقيح أجزاء كبيرة من السجل.
وكتب تشابريا: “من الواضح أن طلب الختم الخاص بشركة Meta ليس مصممًا للحماية من الكشف عن معلومات تجارية حساسة يمكن أن يستخدمها المنافسون لصالحهم”. “يتعلق الأمر أكثر بتجنب أي دعاية سلبية.”
لقد تواصلنا مع Meta PR للتعليق وسنقوم بتحديث هذه المقالة إذا تلقينا ردًا.
تقدم TechCrunch رسالة إخبارية تركز على الذكاء الاصطناعي! سجل هنا لتلقيها في صندوق الوارد الخاص بك كل يوم أربعاء.
Source link