OpenAI توقع صفقة لتدريب الذكاء الاصطناعي على بيانات Reddit
![](https://maywil.tech/wp-content/uploads/2024/05/OpenAI-توقع-صفقة-لتدريب-الذكاء-الاصطناعي-على-بيانات-Reddit.webp-780x470.jpeg)
OpenAI لديه توصل إلى اتفاق مع Reddit لاستخدام البيانات من موقع الأخبار الاجتماعية لتدريب نماذج الذكاء الاصطناعي.
في مشاركة مدونة على موقع العلاقات العامة الخاص بـ OpenAI، قالت الشركة إن شراكة Reddit ستوفر لها إمكانية الوصول إلى “محتوى فريد ومنظم وفي الوقت الفعلي” – مثل المنشورات والردود – من Reddit، مما يمكّن أدواتها ونماذجها من “فهم وتسليط الضوء بشكل أفضل” على هذا الأمر. محتوى. سيتم دمج المحتوى من Reddit في ChatGPTالذكاء الاصطناعي التحادثي الشهير من OpenAI، وستعمل الشركتان معًا لتقديم “ميزات قائمة على الذكاء الاصطناعي” جديدة غير محددة لمستخدمي Reddit والمشرفين.
ستصبح OpenAI أيضًا شريكًا إعلانيًا لـ Reddit.
وكتب OpenAI في المنشور: “سيستفيد Reddit من منصة نموذج الذكاء الاصطناعي الخاصة بـ OpenAI لإضفاء الحيوية على رؤيته القوية”. “إن استخدام LLM وML وAI يسمح لـ Reddit بتحسين تجربة المستخدم للجميع.”
لدى OpenAI العديد من اتفاقيات الترخيص المماثلة مع موفري المحتوى بدءًا من مكتبات الوسائط إلى ناشري الأخبار. ولكن ما هو غير عادي هو أن سام ألتمان، الرئيس التنفيذي لشركة OpenAI، لديه حصة 8.7% في رديتمما جعله ثالث أكبر مساهم، وكان سابقاً عضواً في مجلس إدارة الشركة.
في محاولة لتثبيط التدقيق، قالت OpenAI في بيانها الصحفي إنه بينما لا يزال Altman مساهمًا في Reddit، فإن الشراكة “كانت بقيادة مدير العمليات في OpenAI (Brad Lightcap)” و”تمت الموافقة عليها من قبل مجلس إدارة الإدارة المستقلة لـ OpenAI”. من OpenAI)”. (وسأشير هنا إلى أن ألتمان نفسه هو عضو في مجلس إدارة OpenAI.)
جعلت Reddit من صفقات ترخيص البيانات جزءًا أساسيًا بشكل متزايد من استراتيجية النمو الخاصة بها أثناء تنقلها في السوق كشركة عامة.
في نشرة الاكتتاب العام، رديت كشف أن لديها اتفاقيات تعاقدية لترخيص بياناتها العملاء، بما في ذلك جوجل بقيمة إجمالية تزيد عن 200 مليون دولار. وفي تقرير أرباحها الأول كشركة عامة، أعلنت Reddit عن زيادة بنسبة 450% على أساس سنوي في الإيرادات غير الإعلانية، مدفوعة في المقام الأول بهذه الصفقات.
ارتفع سهم Reddit بنسبة 11% في تداولات ممتدة بعد إعلان صفقة OpenAI.
قال ستيف هوفمان، الرئيس التنفيذي لشركة Reddit، خلال المؤتمر الهاتفي الخاص بأرباح الشركة في شهر مارس: “المفارقة التي أراها هي أنه مع زيادة المحتوى الموجود على الإنترنت الذي يتم كتابته بواسطة الآلات، هناك تفضيل متزايد للمحتوى من أشخاص حقيقيين”. “ولدينا ما يقرب من عقدين من المحادثات الحقيقية.”
تعد منصة Reddit – التي تحتوي على أكثر من مليار مشاركة وأكثر من 16 مليار تعليق، وهي أرقام تنمو كل يوم بفضل مئات الملايين من المستخدمين النشطين – بمثابة منجم ذهب لشركات الإعلان، التي تتعلم نماذجها من نماذج المحتوى. مثل النصوص والصور، لإنشاء محتوى جديد مشابه.
لكن الشركة قد تواجه معارضة من المستخدمين القلقين بشأن كيفية تحقيق الدخل من بياناتهم.
من المفيد إلقاء نظرة على Stack Overflow، منتدى الأسئلة والأجوبة لمطوري البرامج، والذي وقع مؤخرًا صفقة مع OpenAI لتوفير البيانات اللازمة لتدريب نماذج الأخير. واحتجاجًا على ذلك، قام بعض المستخدمين بحذف إجاباتهم ذات التصنيف الأعلى على أسئلة المجتمع. لكن Stack Overflow استعاد المنشورات المحذوفة وحظر هؤلاء المستخدمين، قائلًا إنهم انتهكوا شروط الخدمة الخاصة به.
أعرب Reddit سابقًا عن استيائه من محاولة منح مستخدمي Reddit تحكمًا أكبر في بياناتهم الخاصة.
فاناتحاول شركة ناشئة مبنية على تقنية blockchain، إطلاق بيانات “DAO” (منظمة رقمية مستقلة) للسماح لمستخدمي Reddit بتجميع بياناتهم واتخاذ القرار معًا حول كيفية استخدام هذه البيانات المجمعة (أو بيعها). حظر موقع Reddit موقع Vana الفرعي المخصص لمناقشات DAO، في بيان لموقع TechCrunch، واتهم الشركة “باستغلال” ضوابط تصدير البيانات الخاصة بها.
Source link