تقنية

أصبح نموذج GPT-4o المصغر منخفض الميزانية من OpenAI الآن أرخص أيضًا في الضبط

جوناثان كيتشن / جيتي إيماجيس

تتمثل إحدى الإستراتيجيات الشائعة للتفاعل مع روبوتات الدردشة المولدة للذكاء الاصطناعي في البدء بمطالبة مصممة جيدًا. في الواقع، الهندسة السريعة هي مهارة ناشئة بالنسبة لهؤلاء متابعة التقدم الوظيفي في عصر الذكاء الاصطناعي.

ومع ذلك، هناك بديل. بالنسبة للمطورين الذين لديهم الميزانية المخصصة لتطوير نماذج لغوية كبيرة (LLMs) وكمية كبيرة من البيانات المخصصة، يمكن أن يكون “الضبط الدقيق” لنموذج الذكاء الاصطناعي، في بعض الحالات، نهجًا متميزًا.

لكن الضبط الدقيق يمكن أن يكون مكلفًا، والخبر السار هو أن OpenAI أعلنت يوم الثلاثاء أنها تقدم ضبطًا دقيقًا أرخص بكثير لنموذجها GPT-4o mini AI. قدمت الاسبوع الماضي.

أيضا: تقدم OpenAI GPT-4o mini لتقليل تكاليف التطبيق

تتضمن عملية الضبط الدقيق إخضاع نموذج الذكاء الاصطناعي لجولة جديدة من التدريب بعد التدريب الأولي للنموذج. من خلال تنزيل بعض البيانات وتشغيل التدريب مرة أخرى، يتم تغيير “الأوزان” العصبية (أو “المعلمات”) للنموذج من الإصدار القياسي للنموذج.

والنتيجة هي نموذج يمكنه التركيز بشكل أكبر على البيانات من مجموعة بيانات التدريب الجديدة عندما يُطلب منه إجراء تنبؤات مقارنة بالنموذج القياسي.

تعكس الشبكة العصبية مثل GPT-4o mini توزيعًا احتماليًا، ومخرجاتها (أي تنبؤاتها) هي ببساطة النص الأكثر احتمالية الذي يتبع مطالبة المستخدم. ومن خلال الضبط الدقيق، نقوم بتحريك هذا التوزيع الاحتمالي في اتجاه معين. ونتيجة لذلك، تتغير استجابات النموذج أيضًا لتعكس التوزيع الاحتمالي المتغير.

لذا فإن الضبط الدقيق هو وسيلة لدفع الموجه في الاتجاه المطلوب.

تبدأ تكلفة تطوير Mini GPT-4o بـ 3 دولارات لكل مليون رمز يستخدم للتدريب، وفقًا لدليل التسعير OpenAIهذا أقل من نصف سعر GPT-3.5 “Turbo” البالغ 8 دولارات.

تقدم OpenAI مليوني رمز مجاني يوميًا للمؤسسات المؤهلة حتى 23 سبتمبر.

أيضا: وجد التقرير أن الرجال من جيل الألفية هم الأكثر احتمالاً للتسجيل في دورات تحسين مهارات الذكاء الاصطناعي

ومع ذلك، لاحظ أن سعر جهاز mini GPT-4o المكرر هو ضعف سعر جهاز mini GPT-4o العام، عند 30 سنتًا لكل مليون رمز إدخال في النموذج و1.20 دولار لكل مليون رمز مميز للإخراج – أي الرموز المميزة التي تستخدمها طلب ومن ثم تلقي التوقعات.

إلى جانب ميزة التكلفة، تشير OpenAI إلى أن كمية بيانات التدريب التي يمكن إدخالها في النموذج من أجل الضبط الدقيق تبلغ أربعة أضعاف مثيلتها في GPT-3.5، أي 65000 رمزًا مميزًا.

لاحظ أن الضبط الدقيق متاح فقط لوظيفة النص في GPT-4o mini، وليس لمهام الصور الخاصة به.

قبل الشروع في الضبط الدقيق، يجدر النظر في الخيارات الأخرى. يظل الاستمرار في تحسين المطالبات استراتيجية جيدة، خاصة وأن المطالبات المكررة يمكن أن تكون مفيدة حتى بعد تنقيح النموذج، وفقًا لوثائق OpenAI تطوير التوثيق.

هناك طريقة أخرى للحصول على نتائج أكثر تخصيصًا من LLMs وهي استخدام “زيادة توليد الانتعاش (RAG)”، وهو نهج هندسي شائع بشكل متزايد يتضمن جعل النموذج يقوم باستدعاء مصدر خارجي للحقيقة، مثل قاعدة البيانات.

على الرغم من أن RAG يمكن أن يجعل كل استعلام أثقل، إلى حد ما، عن طريق إجبار النموذج على استدعاء قاعدة البيانات، إلا أن له أيضًا مزايا. عند ضبط النموذج، من الممكن أن يتخلص النموذج من ما تم تعلمه خلال مرحلة التدريب الأولية. بمعنى آخر، يمكن أن يؤدي تغيير معلمات النموذج إلى حدوث انتكاسات فيما يتعلق بالوظائف الأوسع والأكثر عمومية التي يتمتع بها النموذج.

أيضا: إفساح المجال لـ RAG: كيف يتغير توازن القوى في جيل الذكاء الاصطناعي

البديل الثالث، إلى جانب الهندسة الفورية وRAG، ولكنه يرتبط ارتباطًا وثيقًا بـ RAG، هو استدعاء الوظائف. في هذه الحالات، يمكن إدخال أسئلة محددة جدًا في الموجه، جنبًا إلى جنب مع متطلبات نموذج محدد جدًا من الاستجابة، والتي يمكن تعبئتها وإرسالها إلى تطبيق خارجي كاستدعاء دالة. يطلق OpenAI وآخرون على هذا استدعاء الوظائف واستخدام الأدوات و”الذكاء الاصطناعي الوكيل”.

ستجد كل هذه الأساليب مكانها، ولكن على الأقل ستكون تكلفة تجارب الضبط الدقيق أقل قليلاً مع تسعير OpenAI الجديد.

لاحظ أن Google تقدم أيضًا ضبطًا دقيقًا لنماذجها، من خلال برنامج Vertex AI الخاص بها، والعديد من موفري النماذج الآخرين يقومون بذلك أيضًا.

من المرجح أن تصبح نماذج إعادة التدريب أكثر شيوعًا يمكن أن تصل إلى الأجهزة المحمولة في يوم من الأياممع قوة حاسوبية كافية.




Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى