(محدث) تكسر Apple وSalesforce الصمت بشأن مزاعم استخدامهما “مقاطع فيديو مسروقة على YouTube” لتدريب الذكاء الاصطناعي
تم التحديث: 18 يوليو 2024، الساعة 4:44 مساءً بتوقيت شرق الولايات المتحدة تواصلت Salesforce مع Mashable بتعليق ردًا على تقرير Wired.
أ تقرير جديد وفقًا لتحقيق أجرته Proof News ونشر على موقع الشركة، استخدم عمالقة التكنولوجيا مثل Apple وNvidia وAnthropic وSalesforce بيانات من “الآلاف من مقاطع فيديو YouTube” لتدريب الذكاء الاصطناعي. كابلادعى أنه تم نسخ ترجمات من 173000 مقطع فيديو على YouTube لنماذج الذكاء الاصطناعي الخاصة بالشركات.
تحتوي مجموعة البيانات التي تحمل اسم “YouTube Captions” على نصوص فيديو من قنوات تعليمية مثل أكاديمية خان، ومعهد ماساتشوستس للتكنولوجيا، وجامعة هارفارد، بالإضافة إلى وول ستريت جورنالإن بي آر وبي بي سي. كما تم اكتشاف محتوى من نجوم YouTube مثل PewDiePie وMarques Brownlee وMrBeast.
لم نسمع بعد من Anthropic بعد طلب التعليق، لكن Apple وSalesforce أصدرتا ردًا على ذلك سلكي تقرير.
هل ستستخدم Apple هذه البيانات لصالح Apple Intelligence وخدمات الذكاء الاصطناعي الأخرى؟
الإجابة المختصرة هي لا، ولكن إليك الإجابة الأطول لأولئك الذين لا يتعاطفون مع جمهور “TLDR”:
في رسالة بالبريد الإلكتروني إلى Mashable، قالت شركة Apple إن نموذج اللغة مفتوح المصدر الخاص بها، OpenELM، في الواقع لقد استخدمت مجموعة البيانات، ولكن ليس بالطريقة التي قد يعتقدها البعض.
يعد مشروع OpenELM جزءًا من جهود Apple المستمرة لإفادة مجتمع الأبحاث الأوسع. بمعنى آخر، وفقًا لشركة Apple، تم إنشاء نموذج OpenELM لأغراض البحث فقط و اذهب لا دعم أي أجهزة أو خدمات تعتمد على الذكاء الاصطناعي من Apple، بما في ذلك معلومات عن شركة أبل.
سرعة الضوء ماشابل
لغير المطلعين ، معلومات أبل هي مجموعة ميزات الذكاء الاصطناعي الجديدة للشركة، والتي تم الكشف عنها في المؤتمر العالمي للمطورين 2024 (الحدث السنوي لشركة Apple حيث تكشف الشركة عن ما يأتي مع عروض برامجها، بما في ذلك iOS وiPadOS).
معلومات أبلعلى سبيل المثال، يمكن أن يساعد في تلخيص النص، سواء كان بريدًا إلكترونيًا أو رسالة نصية قصيرة، من أجل تفاعل أسرع مع الأصدقاء والأقارب والزملاء وما إلى ذلك. كما أنه سيدعم المزيد من الميزات التي تركز على الترفيه، مثل جينموجيالذي ينشئ رموز تعبيرية جديدة لنظام iOS مع مطالبة. هناك أيضًا Image Playground، والذي يسمح للمستخدمين بإنشاء صور تم إنشاؤها بواسطة الذكاء الاصطناعي بسرعة.
ميزة Genmoji الجديدة قادمة إلى iOS 18
الائتمان: أبل
عندما يتعلق الأمر بمرافق الذكاء الاصطناعي للمستهلكين، وأكدت شركة Apple أنها توفر لمواقع الويب القدرة على إلغاء الاشتراك في استخدام محتواها للتدريب على الذكاء الاصطناعي. وتأكدت شركة Apple من إنشاء نماذجها التوليدية وضبطها بدقة باستخدام بيانات عالية الجودة، بما في ذلك المحتوى المرخص من الناشرين وشركات الصور، بالإضافة إلى البيانات المتاحة للعامة على الويب.
وبإيجاز، لا تنكر شركة أبل أن نموذج اللغة مفتوح المصدر الخاص بها، OpenELM، استخدم مجموعة البيانات، ولكنها تريد أن توضح أنها لن تدعم أيًا من خدمات الذكاء الاصطناعي الخاصة بها، بما في ذلك شركة Apple Intelligence.
تدعي Salesforce استخدامها للأغراض الأكاديمية
في رسالة بالبريد الإلكتروني إلى Mashable، قدمت Salesforce أيضًا جانبها من القصة:
قال أحد ممثلي Salesforce: “تم استخدام مجموعة بيانات Pile المذكورة في الورقة البحثية لتدريب نموذج الذكاء الاصطناعي في عام 2021 للأغراض الأكاديمية والبحثية”. “كانت مجموعة البيانات متاحة للجمهور وتم إصدارها بموجب ترخيص متساهل. »
ماذا تقول نفيديا؟
لقد تواصلنا أيضًا مع Nvidia للتعليق، لكن الشركة، المعروفة بدمج الذكاء الاصطناعي في العديد من أجهزة وخدمات الألعاب الخاصة بها، رفضت إصدار بيان.
سنقوم بتحديث هذه المقالة إذا سمعنا أي شيء من Anthropic.
المواضيع
تفاحة
ذكاء إصطناعي