تشفير

يعترف Elon Musk بأننا استنفدنا بيانات تدريب الذكاء الاصطناعي

يتفق إيلون ماسك مع خبراء آخرين في الذكاء الاصطناعي على أنه لم يتبق سوى القليل من البيانات الحقيقية لتدريب نماذج الذكاء الاصطناعي.

وقال ماسك خلال محادثة مباشرة مع رئيس ستاجويل مارك بن على قناة X مساء الأربعاء: “لقد استنفدنا الآن المجموع التراكمي للمعرفة البشرية… في تدريب الذكاء الاصطناعي”. “لقد حدث هذا بشكل أساسي في العام الماضي.”

ردد ماسك، مالك شركة الذكاء الاصطناعي xAI، أفكار كبير العلماء السابق في OpenAI إيليا سوتسكيفر. موجهة في NeurIPS، مؤتمر التعلم الآلي، خلال كلمة رئيسية في ديسمبر. وتوقع سوتسكيفر، الذي قال إن صناعة الذكاء الاصطناعي وصلت إلى ما أسماه “ذروة البيانات”، أن نقص بيانات التدريب سيجبر على الابتعاد عن الطريقة التي يتم بها تطوير النماذج “اليوم”.

في الواقع، اقترح ماسك أن البيانات الاصطناعية ــ البيانات التي تولدها نماذج الذكاء الاصطناعي ذاتها ــ هي الطريق إلى الأمام. وقال: “إن الطريقة الوحيدة لتكملة (بيانات العالم الحقيقي) هي البيانات الاصطناعية، حيث يقوم الذكاء الاصطناعي بإنشاء (بيانات التدريب)”. “باستخدام البيانات الاصطناعية… (الذكاء الاصطناعي) سوف يقوم بالتقييم الذاتي ويخضع لعملية التعلم الذاتي هذه. »

وتستخدم شركات أخرى، بما في ذلك عمالقة التكنولوجيا مثل مايكروسوفت، وميتا، وأوبن إيه آي، وأنتروبيك، بالفعل البيانات الاصطناعية لتدريب نماذج الذكاء الاصطناعي الرائدة. جارتنر التقديرات تم إنشاء 60% من البيانات المستخدمة في مشاريع الذكاء الاصطناعي والتحليلات في عام 2024 بشكل صناعي.

من مايكروسوفت فاي-4والذي كان مفتوح المصدر اعتبارًا من صباح الأربعاء، تم تدريبه على البيانات الاصطناعية جنبًا إلى جنب مع بيانات العالم الحقيقي. تماما مثل جوجل جوهرة نماذج. استخدمت الأنثروبيك البيانات الاصطناعية لتطوير أحد أنظمتها الأكثر نجاحًا، كلوديوس 3.5 السوناتة. وقد قامت ميتا بتحسين أحدث إصداراتها لاما سلسلة نموذجية باستخدام البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

والتدريب على البيانات الاصطناعية له فوائد أخرى، مثل توفير التكاليف. يقول الكاتب الناشئ في مجال الذكاء الاصطناعي إن نموذج Palmyra X 004، الذي تم تطويره باستخدام مصادر اصطناعية بالكامل تقريبًا، كلف تطويره 700 ألف دولار فقط. مقارنة بتقديرات قدرها 4.6 مليون دولار لنموذج OpenAI ذي الحجم المماثل.

ولكن هناك أيضا عيوب. بعض الأبحاث ويشير إلى أن البيانات الاصطناعية يمكن أن تؤدي إلى انهيار النموذج، حيث يصبح النموذج أقل “إبداعا” ــ وأكثر تحيزا ــ في نتائجه، مما يؤدي في نهاية المطاف إلى تعريض وظائفه للخطر بشكل خطير. وبما أن النماذج تنشئ بيانات تركيبية، فإذا كانت البيانات المستخدمة لتدريب هذه النماذج بها تحيزات وقيود، فستكون نتائجها ملوثة أيضًا.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى