تم عرض عرض توضيحي مخيف لـ “الشكل 01″، وهو روبوت محادثة يشبه الإنسان، على الإنترنت – ولا أستطيع أن أصدق أنه ليس مشهدًا محذوفًا من أنا روبوت.
في العرض التوضيحي، الشكل 01، مملوء بـ OpenAI-tech، نسأله عما يمكنه “رؤيته”. من خلال عرض براعته في التعرف البصري، يشرح الروبوت المتطور بدقة ما يوجد أمامه: تفاحة حمراء، ورف تجفيف به أطباق، والرجل الذي طرح السؤال في الشكل 01.
حسنًا، إنه أمر غريب بعض الشيء، لكنه شيء لم نره من قبل، أليس كذلك؟ على سبيل المثال، أظهرت جوجل في العام الماضي كيف يمكن لنموذج جيميني للذكاء الاصطناعي التعرف على المحفزات الموضوعة أمامه، بدءًا من البطة المطاطية الزرقاء وحتى الرسوم التوضيحية المتنوعة المرسومة يدويًا (على الرغم من أنه تم اكتشافه في وقت متأخر أكثر) التحرير الذكي بالغ قليلاً في قدراته).
ولكن بعد ذلك يسأل الرجل: “هل أستطيع أن آكل شيئًا؟” يمسك الشخصية 01 بالتفاحة، ويدرك بوضوح أنها العنصر الوحيد الصالح للأكل على الطاولة، ويسلمها إليه.
أم، هل نحن متأكدون من أن ويل سميث لن يظهر في أي وقت قريب؟
كيف يعمل الروبوت الشكل 01؟
ما الذي يكمن وراء تفاعل السوائل في الشكل 01 مع الإنسان؟ هذا نموذج جديد للغة المرئية (VLM) يحول الشكل 01 من كومة ضخمة من القمامة إلى روبوت خيال علمي مستقبلي صغير الحجم أيضا شبيه بالإنسان. (يأتي VLM من خلال التعاون مع OpenAI وFiger، الشركة الناشئة التي ابتكرت الشكل 01.)
بعد تسليم التفاحة، يكشف الشكل 01 أنها تستطيع القيام بمهام متعددة عندما تُسأل: “هل يمكنك أن تشرح لماذا (أعطتني التفاحة) بينما تقوم بالتقاط هذه القمامة؟”
أثناء التعرف على ما يعتبر قمامة (وما ليس كذلك) ووضع الأشياء المناسبة في ما يحدده الشكل 01 على أنه سلة المهملات، يشرح الروبوت أنه قدم للرجل تفاحة لأنها كانت الشيء الوحيد الذي يمكن أن يكون أمامه أكل. إنه متعدد المهام مثير للإعجاب!
أخيرًا، سأل الرجل الشكل 01 عن مدى نجاحها في اعتقادها. كجزء من المحادثة، يقول الروبوت: “أعتقد أنني قمت بعمل جيد جدًا. لقد وجدت التفاحة مالكها الجديد، اختفت سلة المهملات، وأصبحت الأطباق في مكانها.”
بحسب بريت أدكوك، مؤسس الشكل، يحتوي الشكل 01 على كاميرات مدمجة تغذي بيانات VLM التي تساعده على “فهم” المشهد أمامه، مما يسمح للروبوت بالتفاعل بسلاسة مع الإنسان الذي أمامه. إلى جانب Adcock، يعد الشكل 01 ثمرة الفكرة الأصلية لـ العديد من اللاعبين الرئيسيين من بوسطن ديناميكس، وتيسلا، وجوجل ديب مايند، وآرتشر للطيران.
التنقيب في إيلون ماسك روبوت أوبتيموس، تفاخر Adcock بأن الشكل 01 لم يتم تشغيله عن بعد. بمعنى آخر، على عكس أوبتيموس الذي انتشر على نطاق واسع بسبب طي القميصيمكن أن يعمل الشكل 01 بشكل مستقل.
هدف Adcock النهائي؟ قم بتدريب نظام ذكاء اصطناعي متقدم للغاية للتحكم في مليارات الروبوتات البشرية، مما قد يحدث ثورة في العديد من الصناعات. يشبه أنا روبوت هو أكثر واقعية بكثير مما كنا نعتقد.