تقنية

تطلق Microsoft Phi-3 Mini، وهو نموذج صغير يعمل بالذكاء الاصطناعي


مايكروسوفت أصدرت Phi-3 Mini، نسخة جديدة من طرازها خفيف الوزن منظمة العفو الدولية نموذج مصمم لمهام محددة.

وفقا للورقة البحثية نشرت في وقت سابق من هذا الأسبوع، يحتوي Phi-3 Mini على 3.8 مليار معلمة، وهو أقل بكثير من النماذج الأخرى مثل OpenAI. جي بي تي-4مما يجعلها صغيرة بما يكفي ليتم نشرها على الهاتف الذكي. OpenAI ولم يشارك عدد معلمات GPT-4، لكن يعتقد أنه يحتوي على أكثر من تريليون. بواسطة سيمافور.

تتطلب نماذج الذكاء الاصطناعي التقليدية كميات هائلة من الطاقة الحاسوبية، وهي مكلفة للغاية ولها قدرة حاسوبية عالية بصمة كربونية ضخمة. وكانت شركات مثل مايكروسوفت وجوجل تعمل على نماذج أصغر حجما وخفيفة الوزن تتعامل مع المهام المشتركة، الأمر الذي من شأنه أن يجعل استضافة نماذجها أكثر استدامة ــ من الناحية التشغيلية ــ وأكثر ملاءمة للهواتف الذكية، التي تركز عليها الصناعة بشدة. سامسونج هي التركيز على الذكاء الاصطناعي التوليدي ومن خلال مجموعة من الميزات لأجهزة Galaxy، تضيف Google أيضًا ميزات عامة ميزات الذكاء الاصطناعي لمجموعة البكسل الخاصة بهاوحتى أبل يجب أن تفعل ذلك إعلانات كبيرة في الذكاء الاصطناعي ل دائرة الرقابة الداخلية 18.

تتعلق المعلمات بكيفية قدرة النماذج على التعامل مع التعقيد. لذلك، كلما زاد عدد المعلمات، زادت قدرة النموذج على التعامل مع المتطلبات الواسعة والدقيقة. ولكن بالنسبة للمهام اليومية التي يحتاج المستخدم العادي إلى نموذج ذكاء اصطناعي للقيام بها، مثل الترجمة أو المساعدة في كتابة بريد إلكتروني أو العثور على مطاعم محلية، فمن المفترض أن يكون النموذج الأصغر حجمًا وخفيف الوزن كافيًا.

سرعة الضوء قابلة للسحق

كان أداء Phi-3 Mini مشابهًا مقابل Llama 3 مفتوح المصدر من Meta وGPT-3.5 من OpenAI وفقًا للمعايير المشتركة، مع بعض الاستثناءات. لقد تفوق في الأداء على Llama 3 وسجل أقل بقليل من GPT 3.5 في فهم اللغة الطبيعية (MMLU) والتفكير المنطقي السليم (HellaSwag) وتغلب على كلا النموذجين في التفكير الحسابي (GSM8K). كما تشير الورقة البحثية، كان أداؤها أقل في الأسئلة التافهة و”المعرفة الواقعية”، لكن الباحثين يعتقدون أن “هذا الضعف يمكن معالجته من خلال تعزيزه بمحرك بحث”، مما يعني أنه بمجرد اتصال النموذج بالإنترنت، لن يكون هذا متاحًا بعد الآن. مشكلة. مشكلة.

قام الباحثون بتدريب Phi-3 Mini على مجموعة من “بيانات الويب التي تمت تصفيتها بشدة” والتي تلبي معايير المعلومات التعليمية عالية الجودة، بالإضافة إلى البيانات الاصطناعية، مما يتحدى فكرة أن استخراج كل شيء من الويب هو أفضل طريقة لتدريب النموذج. تم تدريب العارضة أيضًا على… قصص ما قبل النوم، وفقًا لـ DailyAIوهو أمر منطقي جدًا لفهم كيفية عمل الدماغ البشري. تتمثل الفكرة في التركيز على الجودة بدلاً من الكمية مع تنظيم البيانات بحيث يمكنها العمل بمعلمات أقل مع الحفاظ على قوتها.

جهاز Phi-3 Mini متوفر الآن على HuggingFace وAzure وOllama.




Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى