يزعم استطلاع جديد أن شركات التكنولوجيا استخدمت ترجمات لأكثر من 48000 مقطع فيديو موقع YouTube القنوات – بما في ذلك قنوات كبار المبدعين مثل MrBeast وMarques Brownlee ومؤسسات التعليم العالي مثل معهد ماساتشوستس للتكنولوجيا وهارفارد – لتدريب موظفيهم منظمة العفو الدولية النماذج، على الرغم من أن YouTube يحظر تجميع المحتوى من النظام الأساسي دون تصريح.
تحقيقمن إنتاج Proof News وتم نشره بالتعاون مع كابلوجدت أن شركات مثل Anthropic وNvidia وApple وSalesforce استخدمت مجموعة بيانات مكونة من 173,536 مقطع فيديو على YouTube، بما في ذلك مقاطع فيديو من Khan Academy وMIT وHarvard وThe Wall Street Journal وNPR وBBC وبرامج في وقت متأخر من الليل مثل العرض المتأخر مع ستيفن كولبيرت, الأسبوع الماضي الليلة مع جون أوليفرو جيمي كيميل بشكل مباشر.
نشر ماركيز براونلي مقطع فيديو على إنستغرام أوضح فيه أنه في رأيه “القصة الحقيقية هي أن شركة آبل ومجموعة كاملة من شركات التكنولوجيا الأخرى تقوم بتدريب نماذج الذكاء الاصطناعي الخاصة بها باستخدام البيانات التي يشترونها من شركات استعادة البيانات التابعة لجهات خارجية، وبعضها الذين يحصلون على بياناتهم بطرق غير قانونية إلى حد ما… يمكن لشركة Apple أن تقول من الناحية الفنية إنها ليست مخطئة في هذا الأمر. »
كابل وفقًا لـ EleutherAI، فإن مختبر أبحاث الذكاء الاصطناعي غير الربحي الذي استخرج بيانات يوتيوب ووزعها، لم يستجب لطلبات النشر للتعليق. تعد مجموعة البيانات جزءًا من مجموعة غير ربحية تسمى The Pile، والتي تتضمن أيضًا وثائق من البرلمان الأوروبي ويكيبيديا الإنجليزية ورسائل بريد إلكتروني من موظفي شركة Enron تم إصدارها خلال التحقيق الفيدرالي في الشركة في أوائل العقد الأول من القرن الحادي والعشرين.
عروض Prime Day التي يمكنك تسوقها الآن
يتم اختيار المنتجات المتاحة للشراء هنا عبر الروابط التابعة من قبل فريق التجارة لدينا. إذا قمت بشراء شيء ما من خلال الروابط الموجودة على موقعنا، فقد يحصل Mashable على عمولة تابعة.
سرعة الضوء ماشابل
كابل تشير التقارير إلى أن معظم المجموعات التي تتكون منها The Pile متاحة “لأي شخص على الإنترنت لديه مساحة كافية وقدرة حاسوبية للوصول إليها.” تفاحة, نفيديا, قوة المبيعات, بلومبرج و طوب البياناتوقد اعترف جميعهم علنًا باستخدامهم لـ The Pile لتدريب نماذج الذكاء الاصطناعي.
قالت جينيفر مارتينيز، المتحدثة باسم شركة Anthropic الناشئة في مجال الذكاء الاصطناعي، في بيان لها إنه على الرغم من أن الشركة استخدمت The Pile لتدريب مساعد الذكاء الاصطناعي التوليدي، إلا أن “شروط خدمة YouTube تغطي الاستخدام المباشر لمنصتها، والذي يختلف عن استخدام Pile”. dataset. فيما يتعلق بالانتهاكات المحتملة لشروط خدمة YouTube، يجب أن نحيلك إلى مؤلفي Pile. »
وأضاف براونلي في حسابه على Instagram Reel: “الضربة المزدوجة هي أنني في الواقع أدفع مقابل النسخ اليدوية الأكثر دقة لكل مقطع فيديو ننشره… وهو ما يعني أن النسخ المسروقة هي محتوى مدفوع على وجه التحديد تمت سرقته أكثر من مرة. »
تعكس مخاوفه مخاوف المبدعين في جميع أنحاء العالم الذين يخشون أن يتم استهلاك عملهم أو استغلاله بواسطة الذكاء الاصطناعي دون تعويض أو إذن. كثير من الناس يقاضون حاليا شركات التكنولوجيا بسبب الاستخدام غير المصرح به لعملهم.
كابل تشير التقارير إلى أن The Pile لا يزال متاحًا على خدمات مشاركة الملفات ولكن تمت إزالته من موقع التنزيل الرسمي الخاص به. تم إنشاء Proof News أ أداة للبحث عن منشئي المحتوى في مجموعة بيانات تدريب YouTube AI.
المواضيع
ذكاء إصطناعي