رديت إعلان وفي يوم الثلاثاء، تقوم بتحديث بروتوكول استبعاد الروبوتات (ملف robots.txt)، والذي يخبر روبوتات الويب الآلية ما إذا كان مسموحًا لها بالزحف إلى موقع ما.
تاريخيًا، تم استخدام ملف robots.txt للسماح لمحركات البحث بالزحف إلى موقع ما ثم توجيه الأشخاص إلى المحتوى. ومع ذلك، مع ظهور الذكاء الاصطناعي، يتم إلغاء مواقع الويب واستخدامها لتدريب النماذج دون التعرف على المصدر الفعلي للمحتوى.
إلى جانب ملف robots.txt المحدث، سيستمر Reddit في خنق ومنع الروبوتات وبرامج الزحف غير المعروفة من الوصول إلى نظامه الأساسي. أخبرت الشركة موقع TechCrunch أنه سيتم تقييد أو حظر برامج الروبوت وبرامج الزحف إذا انتهكت سياسة المحتوى العام لـ Reddit ولم يكن لديها اتفاقية مع النظام الأساسي.
يقول موقع Reddit إن التحديث يجب ألا يؤثر على غالبية المستخدمين أو الجهات الفاعلة ذات النية الحسنة، مثل الباحثين والمنظمات، مثل أرشيف الإنترنت. وبدلاً من ذلك، تم تصميم التحديث لتثبيط شركات الذكاء الاصطناعي من تدريب نماذجها اللغوية الكبيرة على محتوى Reddit. بالطبع، يمكن لبرامج زحف الذكاء الاصطناعي تجاهل ملف robots.txt الخاص بموقع Reddit.
ويأتي هذا الإعلان بعد أيام قليلة من أ المسح السلكي اكتشف أن شركة Perplexity، وهي شركة بحث ناشئة تعمل بالذكاء الاصطناعي، كانت تسرق المحتوى وتستخرجه. وجدت Wired أن Perplexity يبدو أنها تتجاهل طلبات عدم إزالة موقعها على الويب، على الرغم من أنها منعت بدء التشغيل في ملف robots.txt الخاص بها. الرئيس التنفيذي لشركة الحيرة أجاب أرافيند سرينيفاس للمطالبات وذكر أن ملف robots.txt ليس إطارًا قانونيًا.
لن تؤثر تغييرات Reddit القادمة على الشركات التي تتعامل معها. على سبيل المثال، رديت لديه صفقة بقيمة 60 مليون دولار مع جوجل والذي يسمح لعملاق البحث بتدريب نماذج الذكاء الاصطناعي الخاصة به على محتوى المنصة الاجتماعية. مع هذه التغييرات، يشير Reddit إلى الشركات الأخرى التي ترغب في استخدام بيانات Reddit للتدريب على الذكاء الاصطناعي بأنه سيتعين عليها الدفع.
وقال موقع Reddit في منشور بالمدونة: “يجب على أي شخص يصل إلى محتوى Reddit أن يتبع سياساتنا، بما في ذلك السياسات المعمول بها لحماية Redditors”. “نحن انتقائيون بشأن الأشخاص الذين نعمل معهم ونمنحهم وصولاً واسع النطاق إلى محتوى Reddit.”
الإعلان ليس مفاجأة، كما رديت أصدرت سياسة جديدة منذ بضعة أسابيع، تم تصميم هذا لتوجيه كيفية الوصول إلى بيانات Reddit واستخدامها من قبل الكيانات التجارية والشركاء الآخرين.
Source link