تشفير

ساعدني وكيل مشغل Openai على التحرك ، لكن كان علي أيضًا مساعدته

أعطاني Openai أسبوعًا لاختبار وكيل الذكاء الاصطناعى الجديد ، المشغلنظام يمكنه القيام بالمهام بشكل مستقل لك على الإنترنت.

المشغل هو أقرب شيء رأيته من الصناعة التكنولوجية رؤية وكلاء الذكاء الاصطناعي – الأنظمة التي يمكن أن تؤدي إلى أتمتة الأجزاء المملة من الحياة ، وتحريرنا للقيام بالأشياء التي نحبها حقًا. ومع ذلك ، إذا حكمنا من خلال تجربتي مع وكيل Openai ، فإن أنظمة الذكاء الاصطناعى “المستقلة” هي دائمًا بعيدة المنال.

Openai شكلت نموذج جديد للمشغل الكهربائيالذي يجمع بين الفهم البصري لـ GPT-4O وقدرات التفكير في O1.

يبدو أن هذا النموذج يعمل بشكل جيد للمهام الأساسية ؛ نظرت إلى أزرار النقرات الخاصة بالمشغل ، والإبحار على مواقع الويب وملء النماذج. تمكنت الذكاء الاصطناعى في بعض الأحيان من اتخاذ التدابير بشكل مستقل ، وهي تعمل بشكل أسرع بكثير من وكلاء الويب التي رأيتها الإنسان و جوجل.

لكن أثناء اختباري ، وجدت نفسي أساعد وكيل Openai أكثر مما أتمنى. شعرت كأنني كنت أتدرب على المشغل من خلال كل مشكلة ، عندما أردت دفع بعض المهام على صحنتي.

في كثير من الأحيان ، أثناء الاختبار ، اضطررت إلى الإجابة على العديد من الأسئلة ، ومنح التراخيص ، وملء المعلومات الشخصية ومساعدة الوكيل عند عالق.

فيما يتعلق بالسيارة ، يشبه المشغل قيادة سيارة مع التحكم في التطواف – أحيانًا يزيل قدميك من الدواسات والسماح للسيارة بتصرف نفسها – لكنها بعيدة عن السائق التلقائي في حد ذاتها.

في الواقع ، يقول Openai أن فواصل المشغل المتكررة هي حسب التصميم.

لا يمكن أن يعمل مشغل طاقة الذكاء الاصطناعى ، كما هو الحال مع AI Feed chatbots مثل Openai chatppt ، بشكل مستقل بشكل مستقل لفترات طويلة ، وهذا يخضع لنفس الهلوسة النوعية. لهذا السبب ، لا يرغب Openai في منح النظام الكثير من القرار -قوة صنع أو معلومات مستخدم حساسة. قد يكون اختيارًا آمنًا لـ Openai ، لكنه يقلل من نشاط المشغل.

ومع ذلك ، فإن أول وكيل Openai هو دليل على مفهوم مثير للإعجاب – وواجهة – لمنظمة العفو الدولية التي يمكنها استخدام مقدمة أي موقع ويب. ولكن لإنشاء أنظمة AI مستقلة حقًا ، سيتعين على الشركات التكنولوجية إنشاء نماذج أكثر موثوقية AI لا تتطلب الكثير من الاتجاه.

قليلا جدا “عملي”

تزامن اختبار المشغل الخاص بي مع الأسبوع الذي نقلت فيه الشقق ، لذلك تلقيت مساعدة من Openai لتحريك الخدمات اللوجستية.

طلبت من المشغل مساعدتي في شراء تصريح وقوف السيارات الجديد. قال لي وكيل Openai: “بالطبع” ، ثم فتح نافذة على متصفحه على شاشة الكمبيوتر الخاص بي.

قام المشغل بعد ذلك بالبحث عن تصريح وقوف السيارات في سان فرانسيسكو في المتصفح ، وأخذني إلى موقع المدينة الصحيحة وحتى الصفحة الصحيحة.

يتيح لك المشغل دائمًا استخدام بقية جهاز الكمبيوتر الخاص بك أثناء عمله ، والذي لا يمكن قوله لمشروع Mariner من Google. في الواقع ، لا يعمل وكيل Openai حقًا على الكمبيوتر ، بل في السحابة في مكان ما.

واجهة المشغل (الائتمان: Maxwell Zeff / Openai)

للحصول على تصريح وقوف السيارات الخاص بي ، اضطررت إلى منح المشغل التفويض لبدء عمليات مختلفة في بعض الأحيان. توقف أيضًا عن طلب مني ملء النماذج بالمعلومات الشخصية – مثل اسمي ورقم هاتفي وعنوان البريد الإلكتروني. في بعض الأحيان ، فقد المشغل أيضًا ، مما أجبرني على السيطرة على المتصفح ووضع الوكيل مرة أخرى على المسار الصحيح.

في اختبار آخر ، طلبت من المشغل إجراء حجز في مطعم يوناني. بناءً على رصيده ، وجد لي المشغل مكانًا ممتعًا في منطقتي بأسعار معقولة. لكن اضطررت إلى الإجابة على أكثر من نصف دزينة من الأسئلة طوال التدفق.

بضع خطوات لإجراء حجز مع المشغل (الائتمان: Maxwell Zeff / Openai)

إذا كان عليك التدخل ست مرات أو أكثر لمجرد حجز الحجز عبر وكيل الذكاء الاصطناعى ، متى يكون من الأسهل القيام بذلك بنفسك؟ هذا سؤال سألته كثيرًا أثناء اختبار المشغل.

وكيل كمنصة

في بعض اختباراتي ، قابلت مواقع الويب التي منعت المشغل لأي سبب. على سبيل المثال ، حاولت حجز كهربائي باستخدام TaskRabbit ، لكن وكيل Openai أخبرني أنه قد أدار خطأ وسألني عما إذا كان بإمكانه استخدام خدمة بديلة بدلاً من ذلك. منعت Expedia و Reddit و YouTube أيضًا وكيل الذكاء الاصطناعى من الوصول إلى منصاتهم.

ومع ذلك ، تتبنى الخدمات الأخرى المشغل بأذرع مفتوحة. تعاونت Instacact و Uber و eBay مع Openai لإطلاق المشغل ، مما يسمح للوكيل بالتنقل على مواقع الويب الخاصة بهم نيابة عن البشر.

تستعد هذه الشركات لمستقبل حيث يتم تسهيل مجموعة فرعية من تفاعلات المستخدم من قبل وكيل الذكاء الاصطناعي.

وقال دانييل دانكر ، مدير المنتج في Instacart ، في مقابلة مع TechCrunch: “يستخدم العملاء Instacart من خلال مجموعة متنوعة من نقاط الدخول المختلفة”. “نرى المشغل ، يحتمل أن يكون ، آخر من نقاط الدخول هذه.”

دع وكيل Openai يستخدم موقع Instacart على الإنترنت نيابة عن شخص ما يفصل Instacact عن عملائه. ومع ذلك ، يقول Danker أن Instacart يريد مقابلة العملاء أينما كانوا.

وقال نيتزان ميكل -بوبرووف ، رئيس شركة EBAY AI ، في مقابلة مع TechCrunch: “نحن متفائلون حقًا بشأن اعتقادنا ، على غرار Openai ، أن أنظمة الوكلاء سيكون لها تأثير كبير على الطريقة التي يتفاعل بها المستهلكون مع الخصائص الرقمية”.

حتى إذا كان وكلاء الذكاء الاصطناعى يتزايد شعبية ، يقول Mekel-Bobrov إنه يتوقع أن يأتي المستخدمون دائمًا إلى موقع eBay ، مشيرًا إلى أن “الوجهات عبر الإنترنت لا تسير في أي مكان”.

مشاكل الثقة

لقد واجهت مشاكل في الثقة بعد المشغل بعد أن تم هلامه عدة مرات وتكلفني عدة مئات من الدولارات تقريبًا.

على سبيل المثال ، طلبت من الوكيل العثور على موقف للسيارات لي بالقرب من شقتي الجديدة. انتهى به الأمر إلى اقتراح اثنين من المرشحين اللذين سيستغرقان فقط بضع دقائق للمشي بضع دقائق.

هلوسة على مسافات نقطة وقوف السيارات (الائتمان: ماكسويل زيف / أوبوباي)

بالإضافة إلى أن تكون بعيدة عن النطاق السعري ، كانت المرائب بعيدة جدًا عن شقتي. كان أحدهما 20 دقيقة ، والآخر كان 30 دقيقة سيرًا على الأقدام. اتضح أن المشغل قد وضع العنوان الخطأ.

هذا هو بالضبط السبب في أن Openai لا يمنح وكيلك رقم بطاقة الائتمان الخاصة بك أو كلمات المرور أو الوصول إلى البريد الإلكتروني. إذا لم يسمح لي Openai بالتدخل هنا ، لكان المشغل يضيع مئات الدولارات في مكان لوقوف السيارات لم أكن بحاجة إليه.

الهلوسة مثل هذه هي سد طريق رئيسي للعوامل المستقلة المفيدة فعليًا – تلك التي يمكن أن تقضي على المهام المزعجة في صحنك. لن يثق أحد في الوكلاء إذا كانوا يميلون إلى ارتكاب أخطاء أساسية ، ولا سيما أخطاء مع العواقب الحقيقية.

مع المشغل ، يبدو أن Openai قام ببناء أدوات رائعة للسماح لأنظمة الذكاء الاصطناعى بتصفح الويب. لكن هذه الأدوات لن تمثل طالما أن الذكاء الاصطناعي المستدام يمكن أن يفعل بشكل موثوق ما يطلبه المستخدمون. حتى ذلك الحين ، سيتم حظر البشر من قبل وكلاء المساعدة – وليس العكس. وهذا النوع من الهزيمة من هذه النقطة.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى