هذا الأسبوع في الذكاء الاصطناعي: دعونا لا ننسى مُعلق البيانات المتواضع

Maywiltech30/03/2024

0 27 5 دقائق

اتبع تطور الصناعة بأسرع ما يمكن منظمة العفو الدولية يمثل تحديا كبيرا. وإلى أن يتمكن الذكاء الاصطناعي من القيام بذلك نيابةً عنك، إليك ملخصًا مفيدًا للقصص الحديثة في عالم التعلم الآلي، بالإضافة إلى الأبحاث والتجارب البارزة التي لم نغطيها بمفردنا.

هذا الأسبوع في مجال الذكاء الاصطناعي، أود تسليط الضوء على الشركات الناشئة في مجال التصنيف والتعليقات التوضيحية – الشركات الناشئة مثل Scale AI، والتي سيكون في محادثات لجمع أموال جديدة بقيمة 13 مليار دولار. قد لا تجذب منصات وضع العلامات والتعليقات التوضيحية الانتباه إلى نماذج الذكاء الاصطناعي التوليدية الجديدة مثل Sora من OpenAI. لكنها ضرورية. وبدونها، من المحتمل ألا تكون نماذج الذكاء الاصطناعي الحديثة موجودة.

يجب تسمية البيانات التي تتدرب عليها العديد من النماذج. لماذا؟ تساعد العلامات أو الإشارات النماذج على فهم البيانات وتفسيرها أثناء عملية التدريب. على سبيل المثال، يمكن أن تأخذ الملصقات المخصصة لتدريب نموذج التعرف على الصور شكل علامات حول الكائنات.صناديق محيطة» أو تعليقات تشير إلى كل شخص أو مكان أو شيء مصور في الصورة.

دقة الملصقات وجودتها لها تأثير كبير على أداء (ووثوقية) النماذج المدربة. والتعليق التوضيحي هو مهمة ضخمة، تتطلب آلاف أو حتى ملايين التسميات لأكبر مجموعات البيانات المستخدمة وأكثرها تطورًا.

لذلك قد تعتقد أن معلقي البيانات سيتم معاملتهم بشكل جيد، وسيدفعون راتبًا لائقًا، وسيتمتعون بنفس المزايا التي يتمتع بها المهندسون الذين يبنون النماذج بأنفسهم. ولكن في كثير من الأحيان، يكون العكس هو الصحيح – بسبب ظروف العمل القاسية التي تفضلها العديد من الشركات الناشئة الخاصة بالتعليقات التوضيحية والتصنيفية.

وقد اعتمدت عليها الشركات التي تمتلك مليارات الدولارات في البنوك، مثل OpenAI لا يدفع المفسرون في دول العالم الثالث سوى بضعة دولارات في الساعة. يتعرض بعض هؤلاء المفسرين لمحتوى مزعج للغاية، مثل الصور الرسومية، لكنهم لا يحصلون على إجازة (لأنهم عادة متعاقدون) أو الوصول إلى موارد الصحة العقلية.

ممتاز قطعة في نيويورك ماج تكشف النقاب بشكل ملحوظ عن Scale AI، الذي يقوم بتجنيد المعلقين في بلدان بعيدة مثل نيروبي أو كينيا. تتطلب بعض مهام Scale AI من واضعي الملصقات العمل لمدة ثماني ساعات في اليوم – دون أي فترات راحة – ودفع مبلغ زهيد يصل إلى 10 دولارات. وهؤلاء العمال يخضعون لأهواء المنصة. في بعض الأحيان، يقضي المدونون فترات طويلة دون الحصول على عمل، أو يتم طردهم بشكل غير رسمي من مقياس الذكاء الاصطناعي – كما حدث للمقاولين في تايلاند وفيتنام وبولندا وباكستان. حديثاً.

تدعي بعض منصات التعليقات التوضيحية ووضع العلامات أنها تقدم أعمال “التجارة العادلة”. في الواقع، لقد جعلوها جزءًا أساسيًا من علامتهم التجارية. ولكن مثل كيت كاي من MIT Tech Review ملاحظاتلا توجد لوائح تنظيمية، فقط معايير صناعية ضعيفة لما يعنيه عمل العلامات الأخلاقية – وتختلف تعريفات الشركة على نطاق واسع.

اذا مالعمل؟ وما لم يكن هناك طفرة تكنولوجية هائلة، فإن الحاجة إلى إضافة تعليقات توضيحية وتصنيف البيانات لتدريب الذكاء الاصطناعي لن تختفي. وبوسعنا أن نأمل أن تنظم المنصات نفسها ذاتيا، ولكن يبدو أن الحل الأكثر واقعية هو تطوير السياسات. وهذا في حد ذاته احتمال صعب، ولكنه أفضل فرصة لدينا لتغيير الأمور نحو الأفضل. أو على الأقل بدأت في ذلك.

فيما يلي بعض قصص الذكاء الاصطناعي الأخرى المثيرة للاهتمام من الأيام الأخيرة:

- يبني OpenAI مستنسخًا صوتيًا: تقوم OpenAI بمعاينة أداة جديدة تعتمد على الذكاء الاصطناعي قامت بتطويرها، وهي Voice Engine، والتي تتيح للمستخدمين استنساخ صوت من تسجيل مدته 15 ثانية لشخص يتحدث. لكن الشركة اختارت عدم توزيعه (حتى الآن) على نطاق واسع، مشيرة إلى مخاطر سوء الاستخدام.
- أمازون تتضاعف على الأنثروبيك: استثمرت أمازون مبلغًا إضافيًا قدره 2.75 مليار دولار في قوة الذكاء الاصطناعي المتنامية لشركة Anthropic، متابعةً لذلك الخيار الذي تركه مفتوحا في سبتمبر الماضي.
- يُطلق Google.org مسرّعًا: تطلق Google.org، الذراع الخيرية لشركة Google، برنامجًا جديدًا مدته ستة أشهر بقيمة 20 مليون دولار للمساعدة في تمويل المؤسسات غير الربحية التي تعمل على تطوير التقنيات التي تستفيد من الذكاء الاصطناعي التوليدي.
- بنية نموذجية جديدة: أصدرت شركة AI21 Labs الناشئة في مجال الذكاء الاصطناعي نموذجًا توليديًا للذكاء الاصطناعي، Jamba، يستخدم بنية نموذجية جديدة – نماذج مساحة الحالة، أو SSM – لتحسين الكفاءة.
- تطلق Databricks DBRX: وفي أخبار النماذج الأخرى، أصدرت Databricks هذا الأسبوع DBRX، وهو نموذج ذكاء اصطناعي توليدي مشابه لسلسلة GPT من OpenAI وGemini من Google. تدعي الشركة أنها حققت نتائج رائدة في الصناعة في عدد من اختبارات الذكاء الاصطناعي الشائعة، بما في ذلك العديد من أسباب القياس.
- أوبر إيتس ولوائح الذكاء الاصطناعي في المملكة المتحدة: تكتب ناتاشا عن كيفية مكافحة تحيز شركة Uber Eats ضد الذكاء الاصطناعي، حيث تظهر أن تحقيق العدالة بموجب لوائح الذكاء الاصطناعي في المملكة المتحدة قد تم تحقيقه بشق الأنفس.
- توجيهات الاتحاد الأوروبي بشأن الأمن الانتخابي: ونشر الاتحاد الأوروبي مسودة مبادئ توجيهية بشأن أمن الانتخابات للسكان المحيطين يوم الثلاثاء. دزينتين المنصات التي تنظمها قانون الخدمات الرقمية، بما في ذلك المبادئ التوجيهية لمنع خوارزميات توصية المحتوى من نشر معلومات مضللة تعتمد على الذكاء الاصطناعي (المعروفة أيضًا باسم التزييف العميق السياسي).
- تمت ترقية Grok: سيحصل روبوت الدردشة Grok الخاص بـ X قريبًا على نموذج أساسي محسّن، Grok-1.5 – وفي الوقت نفسه، سيحصل عليه جميع المشتركين المميزين على X. تنضم إلى جروك. (كان Grok في السابق حصريًا لعملاء X Premium+.)
- تقوم Adobe بتوسيع Firefly: كشفت شركة Adobe هذا الأسبوع عن خدمات Firefly، مجموعة تضم أكثر من 20 واجهة برمجة تطبيقات وأدوات وخدمات جديدة ومبتكرة. أطلقت Adobe أيضًا قوالب مخصصة، والتي تسمح للشركات بضبط قوالب Firefly بناءً على أصولها. GenStudio التالي.

المزيد من التعلم الآلي

ما هو الطقس؟ الذكاء الاصطناعي قادر بشكل متزايد على إخبارك بهذا. لقد لاحظت بعض الجهود في توقعات كل ساعة، أسبوعية والقرن منذ بضعة أشهر، ولكن كما هو الحال مع كل ما يتعلق بالذكاء الاصطناعي، فإن هذا المجال يتطور بسرعة. نشرت الفرق التي تقف وراء MetNet-3 وGraphCast ورقة بحثية تصف نظامًا جديدًا يسمى بذورلأخذ العينات من انتشار المغلف القابل للتطوير.

رسوم متحركة توضح كيف أن المزيد من التوقعات تؤدي إلى توزيع أكثر توازناً لتوقعات الطقس.

يستخدم SEEDS البث لتوليد “مجموعات” من نتائج الطقس المعقولة لمنطقة ما بناءً على بيانات الإدخال (قراءات الرادار أو الصور المدارية ربما) بشكل أسرع بكثير من النماذج القائمة على الفيزياء. مع وجود عدد أكبر من المجموعات، يمكنهم تغطية المزيد من الحالات المتطورة (مثل حدث يحدث فقط في 1 من 100 سيناريو محتمل) ويكونون أكثر ثقة بشأن المواقف الأكثر احتمالية.

وتأمل فوجيتسو أيضًا في فهم العالم الطبيعي بشكل أفضل تطبيق تقنيات معالجة الصور بالذكاء الاصطناعي على التصوير تحت الماء وبيانات الليدار التي تم جمعها بواسطة المركبات ذاتية التحكم تحت الماء. سيسمح تحسين جودة التصوير للعمليات الأخرى الأقل تعقيدًا (مثل التحويل ثلاثي الأبعاد) بالعمل بشكل أفضل على البيانات المستهدفة.

اعتمادات الصورة: فوجيتسو

وتتمثل الفكرة في بناء “توأم رقمي” للمياه يمكنه المساعدة في محاكاة التطورات الجديدة والتنبؤ بها. نحن بعيدون عن ذلك، ولكن علينا أن نبدأ من مكان ما.

من بين حاملي شهادة الماجستير في القانون، اكتشف الباحثون أنهم يقلدون الذكاء بطريقة أبسط مما كان متوقعًا: الوظائف الخطية. بصراحة، الرياضيات خارج نطاق قدراتي (الأشياء المتجهة في العديد من الأبعاد) ولكن هذه المقالة في معهد ماساتشوستس للتكنولوجيا يُظهر بوضوح أن آلية رد الاتصال لهذه النماذج… أساسية تمامًا.

على الرغم من أن هذه النماذج عبارة عن وظائف غير خطية معقدة للغاية، ومدربة على الكثير من البيانات ومن الصعب جدًا فهمها، إلا أنها تحتوي في بعض الأحيان على آليات بسيطة جدًا. وقال المؤلف المشارك إيفان هيرنانديز: “هذا مثال على ذلك”. إذا كان لديك عقل أكثر تقنية، عرض المجلة هنا.

أحد أسباب فشل هذه النماذج هو عدم فهم السياق أو ردود الفعل. حتى طلاب LLM المؤهلين حقًا قد لا “يفهمون الأمر” إذا أخبرتهم أن اسمك يُنطق بطريقة معينة، لأنهم لا يعرفون أو يفهمون أي شيء. في الحالات التي قد يكون فيها هذا مهمًا، مثل التفاعلات بين الإنسان والروبوت، فقد يؤدي ذلك إلى إبعاد الناس إذا تصرف الروبوت بهذه الطريقة.

لقد درست شركة Disney Research منذ فترة طويلة التفاعلات الآلية بين الشخصيات و نطق هذا الاسم وإعادة استخدام الورق لقد وصلت للتو منذ وقت قصير. يبدو هذا واضحًا، لكن استخراج المقاطع الصوتية عندما يقوم شخص ما بتقديم نفسه وترميزها بدلاً من مجرد الاسم المكتوب يعد أسلوبًا ذكيًا.

اعتمادات الصورة: بحث ديزني

أخيرًا، مع التداخل المتزايد بين الذكاء الاصطناعي والأبحاث، من المفيد إعادة تقييم كيفية استخدام هذه الأدوات وما إذا كان هذا الاتحاد غير الطبيعي يمثل مخاطر جديدة. لقد كانت صفية أوموجا نوبل صوتًا رائدًا في مجال الذكاء الاصطناعي وأخلاقيات البحث لسنوات، وكان رأيها مفيدًا دائمًا. لقد أجرت مقابلة رائعة مع الفريق الصحفي لجامعة كاليفورنيا حول كيفية تطور عمله ولماذا نحتاج إلى البقاء هادئين تجاه التحيز والعادات السيئة في البحث.

Source link

Maywiltech30/03/2024

0 27 5 دقائق