Deepseek R1: لماذا يعتقد خبراء IA أنه مميز للغاية

Maywiltechمنذ 7 أيام

0 0 3 دقائق

فجأة، بعمق في كل مكان.

إنها نموذج R1 هو المصدر مفتوحًا ، ويُزعم أنه تم تدريبه على جزء صغير من تكلفة نماذج الذكاء الاصطناعى الأخرى ، وهو جيد تمامًا ، إن لم يكن أفضل من ChatGPT.

هذا المزيج القاتل قوي قوي في وول ستريتإثارة الانخفاض في الإجراءات التكنولوجية وجعل المستثمرين يتساءلون عن مقدار الأموال اللازمة لتطوير نماذج جيدة من الذكاء الاصطناعي. في الطلب تم تشكيل R1 على 2788 وحدات معالجة الرسومات التي تكلف حوالي 6 ملايين دولار ، مقارنة مع Openai GPT-4 التي سيكون تكلف 100 مليون دولار للتدريب.

تشكك ربحية ديبسيك أيضًا في فكرة أن نماذج البيانات الأكبر والمزيد من البيانات تؤدي إلى أداء أفضل. في خضم المحادثة المحمومة حول قدرات Deepseek ، وتهديدها لشركات AI مثل Openai والمستثمرين المخيفون ، قد يكون من الصعب فهم ما يجري. لكن خبراء IA يتمتعون بخبرة في قدامى المحاربين لديهم احتمالات ثمينة.

يثبت Deepseek ما يقوله خبراء IA لسنوات: الأكبر ليس أفضل

كان على القيود التجارية والوصول إلى وحدة معالجة الرسومات NVIDIA ، Deepseek ، ومقرها الصين ، إظهار الإبداع في تطوير وتدريب R1. كانت حقيقة أنهم تمكنوا من إنجاز هذا الإنجاز مقابل 6 ملايين دولار فقط (وهو ليس الكثير من المال من حيث الذكاء الاصطناعي) بمثابة الوحي للمستثمرين.

لكن خبراء الذكاء الاصطناعى لم يفاجأوا. “في Google ، سألت لماذا أجبروا على بناء أكبر نموذج. لماذا ستذهب إلى الحجم؟ ما هي الوظيفة التي تحاول أداءها؟ ملصق Timnit Gebru ، الذي كان مشهورًا من Google لدعوة تحيزات الذكاء الاصطناعي ، على X.

سرعة الإضاءة mashable

ربما تم حذف تغريدة

وجهأكد مناخ وإدارة منظمة العفو الدولية ساشا لوكوني كيف يتم بناء استثمار IA بشكل غير مستقر على التسويق والوسائط. “من المتوحش أن واحدة من LLM (عالية الكفاءة) قادرة على تحقيق هذا الأداء دون القرف الخام على الآلاف من وحدات معالجة الرسومات كافية لإثارة ذلك ،” قال لوكوني.

ربما تم حذف تغريدة

توضيح لماذا Deepseek R1 مشكلة كبيرة

Deepseek R1 صنعت بطريقة مماثلة لنموذج Openai O1 على المراجع الرئيسية. لقد تجاوزت بشكل هامشي ، أو تساوي أو انخفض أقل بقليل من O1 على الرياضيات والترميز واختبارات المعرفة العامة. وهذا يعني أن هناك نماذج أخرى ، مثل الأنثروبور كلود ، وجيميني Google و Meta Open Source Model Llama والتي هي قادرة على المستخدم العادي.

لكن R1 يثير مثل هذا الهيجان بسبب التكلفة المنخفضة التكلفة. “إنها ليست أكثر ذكاءً من النماذج السابقة ، التي تم تدريبها بتكلفة أقل” ، “،” ، “،” ، “،”. قال الباحث IA غاري ماركوس.

ربما تم حذف تغريدة

حقيقة أن Deepseek كان قادرًا على بناء نموذج يتنافس مع نماذج Openai أمر رائع للغاية. Andrej Karpathy الذي شارك في Openai ، ملصق على X ، “هل هذا يعني أنك لا تحتاج إلى تصفح البيانات والخوارزميات.”

ربما تم حذف تغريدة

وارتون أستاذ إيثان موليك قال هذه ليست قدراته ، ولكن النماذج التي يمكن للأشخاص الوصول إليها حاليًا. وقال “Deepseek هو نموذج جيد للغاية ، لكنه عمومًا ليس نموذجًا أفضل من O1 أو Claude”. “لكن نظرًا لأنه مجاني ويجذب الكثير من الاهتمام ، أعتقد أن العديد من الأشخاص الذين استخدموا نماذج” Mini “المجانية تتعرض لما يمكن أن يفعله التفكير في بداية عام 2025 وتفاجأ.”

ربما تم حذف تغريدة

علامة واحدة لنماذج المصدر المفتوح

يعد Deepseek R1 Breakout انتصارًا كبيرًا لأنصار المصادر المفتوحة الذين يجادلون بأن إضفاء الطابع الديمقراطي للوصول إلى النماذج القوية من الذكاء الاصطناعي يضمن الشفافية والابتكار والمنافسة الصحية. “للأشخاص الذين يعتقدون أن” الصين تتجاوز الولايات المتحدة في الذكاء الاصطناعي “، التفكير الجيد هو أن” النماذج المفتوحة المصدر تتجاوز تلك المغلقة “،” “” قال يان ليكون ، كبير العلماء في منظمة العفو الدولية في ميتا ، الذي دعم العرض المفتوح مع نماذج لاما الخاصة به.

ربما تم حذف تغريدة

لم يذكر عالم الكمبيوتر وخبير في AI Andrew NG صراحة أهمية R1 كونها نموذجًا مفتوحًا المصدر ، ولكنه أكد على مدى اضطراب عميق للمطورين ، لأنه يتيح أيضًا الوصول إلى Gatket بواسطة Big Tech.

“اليوم ،” Deepseek Seloff “في سوق الأوراق المالية – المخصصة لـ Deepseek V3 / R1 التي تزعج النظام الإيكولوجي التكنولوجي – هي علامة أخرى على أن طبقة التطبيق هي مكان ممتاز لتكون” ، “،” ، “،” قال نانوغرام. “طبقة نموذج الأساس هي المنافسة المفرطة مثالية لتطبيقات إنشاء الناس.”