تقنية

لقد قمت بإخضاع النسخة المجانية من Perplexity.ai لاختبارات البرمجة الخاصة بي – وهذا ما حدث

نورمان بوسيلت / جيتي إيماجيس

لدي قدرات الترميز التي تم اختبارها العديد من أدوات الذكاء الاصطناعي التوليدية لـ ZDNET – وهذه المرة، حان دور الحيرة.ai.

تبدو الحيرة وكأنها تقاطع بين محرك بحث وروبوت محادثة يعمل بالذكاء الاصطناعي. عندما سألت الحيرة كيف تختلف عن الآخرين الذكاء الاصطناعي التوليدي وقال الروبوت إنه يستخدم الوصول إلى المعلومات في الوقت الفعلي، ويقوم بفهرسة الويب يوميًا. يمكن للمستخدمين تحسين عمليات البحث الخاصة بهم عن طريق مطالبة Perplexity بالتركيز على المصادر أو الأنظمة الأساسية.

أيضا: كيفية استخدام ChatGPT لكتابة التعليمات البرمجية: ما الذي يمكنه فعله وما لا يمكنه فعله لك

النسخة المجانية من Perplexity محدودة للغاية. ويستخدم نموذج OpenAI’s GPT-3.5 للتحليل، ولا يسمح إلا بخمسة أسئلة يوميًا، وبينما يدعم تحميل المستندات، فإن هذه التحميلات تقتصر على ثلاثة أسئلة يوميًا.

تبلغ تكلفة الإصدار الاحترافي من Perplexity 20 دولارًا شهريًا. يتيح هذا الإصدار عمليات بحث “سريعة” غير محدودة و600 عملية بحث احترافية يوميًا واختيار نموذج الذكاء الاصطناعي. يمكنك الاختيار من بينها جي بي تي-4o, كلود 3السونار الكبير (LLaMa 3) وغيرها. يوفر الإصدار Pro أيضًا 5 دولارات شهريًا من أرصدة واجهة برمجة التطبيقات (API).

قررنا التخلي عن الإصدار Pro وتشغيل الإصدار المجاني لاختبارنا الأولي لبراعة البرمجة في Perplexity. لقد أجريت اختبارات الترميز هذه ضد الذكاء الاصطناعي بنتائج متفاوتة. إذا كنت تريد المتابعة، فوجّه متصفحك إلى “كيف أختبر قدرات البرمجة الخاصة ببرنامج Chatbot الذي يعمل بالذكاء الاصطناعي – ويمكنك القيام بذلك أيضًا“، والذي يحتوي على جميع الاختبارات القياسية التي أستخدمها، وشرحًا لكيفية عملها، وتفاصيل عما يجب البحث عنه في النتائج.

أيضا: هل سيتولى الذكاء الاصطناعي مهام البرمجة أم سيحول المبرمجين إلى مديري الذكاء الاصطناعي؟

الآن دعونا نلقي نظرة على نتائج كل اختبار ونرى كيفية مقارنتها بالاختبارات السابقة باستخدام كلوديوس 3.5 السوناتة, مايكروسوفت مساعد الطيار, ميتا الذكاء الاصطناعي, ميتا كود لاما, جوجل الجوزاء المتقدمو ChatGPT.

1. اكتب مكونًا إضافيًا لـ WordPress

وهذا التحدي يتطلب عدة أشياء. أولاً، يطلب من الذكاء الاصطناعي إنشاء واجهة مستخدم لإدخال الصفوف بشكل عشوائي (ولكن ليس إلغاء التكرار). ثم يطلب الاختبار من الذكاء الاصطناعي إنشاء زر لا يقوم فقط بترتيب القائمة بشكل عشوائي، بل يضمن أيضًا عرض أي عناصر مكررة بحيث لا تكون بجوار بعضها البعض في القائمة الناتجة.

حتى الآن، أنشأت معظم أنظمة الذكاء الاصطناعي، باستثناء Meta Code Llama، واجهة مستخدم معقولة جدًا. كان البعض أكثر جاذبية من البعض الآخر، لكنهم جميعًا أنجزوا المهمة.

أيضا: قم بالبرمجة بشكل أسرع باستخدام الذكاء الاصطناعي التوليدي، ولكن احذر من المخاطر عند القيام بذلك

ومع ذلك، فإن ChatGPT (3.5 و4 و4o) هو الوحيد الذي أنتج المخرجات العشوائية الصحيحة. معظم أنظمة الذكاء الاصطناعي الأخرى قدمت ببساطة زرًا، عند النقر عليه، لا يفعل شيئًا.

عملت الحيرة. لقد أنتج واجهة مستخدم مطابقة للمواصفات وعمل الزر Randomize وفصل الخطوط المكررة.

فيما يلي النتائج المجمعة لهذا الاختبار والاختبارات السابقة:

  • الحيرة: الواجهة: جيدة، الوظيفة: جيدة
  • كلوديوس 3.5 السوناتة: الواجهة: جيدة، الوظيفة: الفشل
  • ChatGPT GPT-4o: الواجهة: جيدة، الوظيفة: جيدة
  • مساعد مايكروسوفت: الواجهة: كافية، الوظيفة: معيبة
  • ميتا الذكاء الاصطناعي: الواجهة: كافية، الوظيفة: معيبة
  • رمز تعريف اللاما: فشل كامل
  • جوجل الجوزاء المتقدم: الواجهة: جيدة، الوظيفة: الفشل
  • الدردشةGPT 4: الواجهة: جيدة، الوظيفة: جيدة
  • شات جي بي تي 3.5: الواجهة: جيدة، الوظيفة: جيدة

2. إعادة كتابة دالة السلسلة

يعمل هذا الاختبار على إصلاح وظيفة التحقق من الصحة التي تتحقق من الدولارات والسنتات.

كان الرمز الأصلي الخاص بي خاطئًا، حيث سمح فقط بالدولارات الكاملة، ولكن ليس بالسنتات. لقد اكتشفت ذلك عندما أرسل أحد المستخدمين تقريرًا عن خطأ. قمت أولاً بتمرير الرمز غير الصحيح إلى ChatGPT، الذي قام بعمل جيد في إعادة كتابة الوظيفة للسماح بمبالغ بالدولار ورقمين على يمين العلامة العشرية.

كما اجتاز الحيرة هذا الاختبار.

كان من الممكن أن يكون الكود الذي تم إنشاؤه أكثر دقة، لكنه نجح. في حالة احتواء السلسلة التي يقدمها المستخدم على أصفار فقط، فإن تطبيق Perplexity يزيل كل شيء. للتعويض، قامت شركة Perplexity أولاً بالتحقق من وجود الصفر.

أيضا: هل ترغب في دمج الذكاء الاصطناعي في هندسة البرمجيات؟ إليك كل ما تحتاج إلى معرفته

هذا النهج ممكن، ولكن من الممكن أن يكون التعبير العادي الناتج عن Perplexity مكتوبًا لمراعاة هذا الاختلاف. يعد هذا خيار تنفيذ بسيط والعديد من المبرمجين المهرة سيختارون أيًا من المسارين، لذا فإن نهج Perplexity مقبول.

قام كود Perplexity باختبار البيانات المقدمة بشكل صحيح للتأكد من مطابقتها لتنسيق الدولارات والسنتات. ثم قام الكود بتحويل السلسلة إلى رقم. كما يتم التحقق مما إذا كان الرقم الذي تم تحليله صحيحًا وليس سلبيًا.

شاملة، الحيرة أنتجت كودًا قويًا. فيما يلي النتائج المجمعة لهذا الاختبار والاختبارات السابقة:

  • الحيرة: ناجح
  • كلوديوس 3.5 السوناتة: فشل
  • ChatGPT GPT-4o: ناجح
  • مساعد مايكروسوفت: فشل
  • ميتا الذكاء الاصطناعي: فشل
  • رمز تعريف اللاما: ناجح
  • جوجل الجوزاء المتقدم: فشل
  • الدردشةGPT 4: ناجح
  • شات جي بي تي 3.5: ناجح

3. ابحث عن خطأ مزعج

لقد أربكني خطأ في الكود الخاص بي، لذلك لجأت إلى ChatGPT للحصول على المساعدة. اتضح أن مصدر المشكلة لم يكن واضحًا بشكل بديهي، ولهذا السبب فاتني ذلك.

يتطلب خطأ تمرير المعلمة معرفة كيفية عمل إطار عمل WordPress. لقد فاتني الخطأ لأن PHP يبدو أنها تشير ضمنًا إلى أن المشكلة كانت في جزء ما من الكود بينما كانت المشكلة في الواقع هي كيفية انتقال الكود عبر عملية خاصة بـ WordPress.

وجدت الحيرة المشكلة وشخصت الحل بشكل صحيح.

أيضا: هل يمكن للذكاء الاصطناعي أن يكون لاعبًا جماعيًا في تطوير البرمجيات التعاونية؟

فيما يلي النتائج المجمعة لهذا الاختبار والاختبارات السابقة:

  • الحيرة: ناجح
  • كلوديوس 3.5 السوناتة: ناجح
  • ChatGPT GPT-4o: ناجح
  • مساعد مايكروسوفت: فشل
  • ميتا الذكاء الاصطناعي: ناجح
  • رمز تعريف اللاما: فشل
  • جوجل الجوزاء المتقدم: فشل
  • الدردشةGPT 4: ناجح
  • شات جي بي تي 3.5: ناجح

4. كتابة السيناريو

يحلل هذا الاختبار النهائي مدى قاعدة معارف الذكاء الاصطناعي. يتطلب الاختبار إنشاء تعليمات برمجية تتطلب معرفة Chrome Document Object Model وAppleScript وأداة برمجة نصية تابعة لجهة خارجية لنظام التشغيل Mac تسمى Keyboard Maestro.

يبدو أن شركة Perplexity لم تكن تعرف شيئًا عن Keyboard Maestro، لذلك لم تكتب الاستدعاء الضروري للغة البرمجة النصية لاسترداد قيمة المتغير.

أيضا: ما وراء البرمجة: الذكاء الاصطناعي يؤدي إلى ظهور جيل جديد من المهن

الحيرة أيضا نفس الخطأ الذي ارتكبه كلوديوس 3.5 السوناتةإنشاء سطر من التعليمات البرمجية لـ AppleScript قد يؤدي إلى ظهور رسالة خطأ في بناء الجملة في وقت التشغيل. يشير هذا الخطأ إلى نقص المعرفة حول كيفية تجاهل AppleScript للأحرف الكبيرة والصغيرة، وكيف يأخذ حالة سلسلة في الاعتبار عند مقارنة قيمتين.

فيما يلي النتائج المجمعة لهذا الاختبار والاختبارات السابقة:

  • الحيرة: فشل
  • كلوديوس 3.5 السوناتة: فشل
  • ChatGPT GPT-4o: ناجحة ولكن مع تحفظات
  • مساعد مايكروسوفت: فشل
  • ميتا الذكاء الاصطناعي: فشل
  • رمز تعريف اللاما: فشل
  • جوجل الجوزاء المتقدم: ناجح
  • الدردشةGPT 4: ناجح
  • شات جي بي تي 3.5: فشل

النتائج النهائية

وفيما يلي النتائج الإجمالية للاختبارات الأربعة:

بشكل عام، الحيرة كان أداؤه جيدًا. اعتقدت أن الذكاء الاصطناعي قد يفشل في الاختبار الرابع، لأن ChatGPT 3.5 فعل ذلك، والنسخة المجانية من Perplexity تستخدم نموذج GPT-3.5.

لقد فوجئت بهذه النتائج لأنه من المفترض أيضًا أن يستخدم برنامج Copilot من Microsoft محرك OpenAI للذكاء الاصطناعي، لكن برنامج Copilot فشل في كل شيء تقريبًا. عكست الحيرة نتائج GPT-3.5، وهو أمر منطقي نظرًا لأن الإصدار المجاني يستخدم GPT-3.5.

اسمحوا لي أن أعرف إذا كنت تريد أن ترى كيفية أداء Perplexity Pro. إذا تلقيت طلبات كافية سأقوم بالتسجيل رسوم الذكاء الاصطناعي الشهرية الأخرى وإجراء بعض الاختبارات.

هل جربت الإصدار المجاني من Perplexity أو نسخته الاحترافية؟ اسمحوا لنا أن نعرف في التعليقات أدناه.


يمكنك متابعة التقدم المحرز في مشاريعي يوما بعد يوم على الشبكات الاجتماعية. لا تنسى الاشتراك في رسالتي الإخبارية التحديث الأسبوعيةوتابعوني على Twitter/X على @ ديفيد جويرتزعلى الفيسبوك في Facebook.com/DavidGewirtzعلى الانستقرام على Instagram.com/DavidGewirtzوعلى موقع يوتيوب في YouTube.com/DavidGewirtzTV.




Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى