تريد AWS، وهي شركة الحوسبة السحابية التابعة لأمازون، أن تصبح المكان المفضل للشركات لاستضافة وتحسين نماذج الذكاء الاصطناعي التوليدية المخصصة الخاصة بها.
أعلنت AWS اليوم عن إطلاق Custom Model Import (معاينة)، وهي ميزة جديدة في Bedrock، وهي مجموعة AWS من خدمات الذكاء الاصطناعي التوليدية للشركات، والتي تسمح للمؤسسات باستيراد نماذج الذكاء الاصطناعي التوليدية الداخلية الخاصة بها و”الوصول إليها باعتبارها واجهات برمجة التطبيقات المُدارة بالكامل”. .
تستفيد النماذج الخاصة بالشركات، بمجرد استيرادها، من نفس البنية التحتية مثل نماذج الذكاء الاصطناعي التوليدية الأخرى في مكتبة Bedrock (مثل Llama 3 من Meta، وClaude 3 من Anthropic)، بما في ذلك الأدوات اللازمة لتوسيع معرفتها وصقلها وتنفيذ الضمانات للتخفيف من آثارها. تأثيرات. الأحكام المسبقة.
قال فاسي فيلومين، نائب رئيس الذكاء الاصطناعي التوليدي في AWS، لـ TechCrunch في مقابلة: “قام بعض عملاء AWS بتعديل أو إنشاء نماذجهم الخاصة خارج Bedrock باستخدام أدوات أخرى”. “تسمح لهم ميزة استيراد القالب المخصص هذه بإحضار قوالبهم الخاصة إلى Bedrock ورؤيتها بجوار جميع القوالب الأخرى الموجودة بالفعل على Bedrock – واستخدامها مع أي مسارات عمل موجودة بالفعل على Bedrock. “.
استيراد القوالب المخصصة
بحسب حديث إستفتاء الرآي العام وفقًا لـ Cnvrg، الشركة التابعة لشركة Intel التي تركز على الذكاء الاصطناعي، فإن غالبية الشركات تتعامل مع الذكاء الاصطناعي التوليدي من خلال إنشاء نماذج خاصة بها وتحسينها بناءً على تطبيقاتها. ووفقاً للاستطلاع، تقول هذه الشركات نفسها إنها تنظر إلى البنية التحتية، بما في ذلك البنية التحتية للحوسبة السحابية، باعتبارها أكبر عائق أمام النشر.
من خلال Custom Model Import، تهدف AWS إلى الإسراع في تلبية الاحتياجات مع مواكبة منافسيها السحابيين. (آندي جاسي، الرئيس التنفيذي لشركة أمازون تم تصوره مسبقًا بنفس القدر في رسالتها السنوية الأخيرة إلى المساهمين.)
لبعض الوقت، سمحت Vertex AI، المكافئة لـ Bedrock من Google، للعملاء بتحميل نماذج الذكاء الاصطناعي التوليدية، وتخصيصها، وتقديمها من خلال واجهات برمجة التطبيقات. كما قدمت Databricks منذ فترة طويلة مجموعات أدوات لاستضافة النماذج المخصصة وتعديلها، بما في ذلك النموذج الذي تم إصداره مؤخرًا. دي بي آر إكس.
عندما سئل ما الذي يميز Custom Model Import، ادعى Philomin أنه – وبالتالي Bedrock – يقدم نطاقًا أوسع وعمقًا لخيارات تخصيص النموذج مقارنة بالمنافسة، مضيفًا أن “عشرات الآلاف من العملاء يستخدمون Bedrock الآن.
قال فيلومين: “أولاً، توفر شركة Bedrock للعملاء طرقًا متعددة لإدارة نماذج الخدمة”. “ثانيًا، لدينا مجموعة كاملة من مسارات العمل حول هذه النماذج – والآن يمكن للعملاء اجلس بجوار جميع التصميمات الأخرى المتوفرة لدينا بالفعل. أحد العناصر الأساسية التي يحبها معظم الأشخاص هو القدرة على تجربة عدة نماذج مختلفة باستخدام نفس سير العمل ثم وضعها في الإنتاج من نفس المكان.
إذًا، ما هي خيارات تخصيص النموذج التي تمت مناقشتها؟
يشير Philomin إلى Guardrails، الذي يسمح لمستخدمي Bedrock بتكوين عتبات لتصفية – أو على الأقل محاولة التصفية – نتائج النماذج لأشياء مثل خطاب الكراهية والعنف والمعلومات الشخصية أو معلومات الشركة الخاصة. (من المعروف أن نماذج الذكاء الاصطناعي التوليدية أثناء الذهاب خارج المسار في طرق إشكاليةبما في ذلك تسرب المعلومات الحساسة؛ لقد كانت AWS لا استثناء.) كما سلط الضوء على تقييم النموذج، وهو أداة أساسية يمكن للعملاء استخدامها لاختبار أداء نموذج – أو عدة نماذج – على مجموعة معينة من المعايير.
تتوفر الآن حواجز الحماية وتقييم النماذج بشكل عام بعد معاينة لعدة أشهر.
أشعر بأنني ملزم بالإشارة هنا إلى أن استيراد النماذج المخصصة يدعم فقط ثلاثة بنيات نموذجية في الوقت الحالي – نماذج Hugging Face’s Flan-T5 وMeta’s Llama وMistral – وأن Vertex AI وغيرها من الخدمات المنافسة لـ Bedrock، بما في ذلك أدوات تطوير الذكاء الاصطناعي من Microsoft على Azure، تقدم قدرات أمنية وتقييمية قابلة للمقارنة إلى حد ما (انظر أمان محتوى Azure AI, تقييم النموذج في فيرتكس و هكذا).
ماذا شرق ومع ذلك، تعد عائلة AWS Titan من نماذج الذكاء الاصطناعي التوليدية فريدة من نوعها بالنسبة لـ Bedrock. و- بالتزامن مع إصدار Custom Model Import – هناك العديد من التطورات الملحوظة على هذه الجبهة.
نماذج تيتان محسنة
تيتان مولد الصورأصبح نموذج تحويل النص إلى صورة من AWS متاحًا الآن للجميع بعد إطلاق المعاينة في نوفمبر الماضي. كما كان من قبل، يمكن لـ Titan Image Generator إنشاء صور جديدة من وصف نصي أو تخصيص الصور الموجودة، على سبيل المثال عن طريق استبدال خلفية الصورة مع الاحتفاظ بالموضوعات في الصورة.
ومقارنة بإصدار المعاينة، يستطيع Titan Image Generator في GA إنشاء صور بمزيد من “الإبداع”، كما قال فيلومين، دون الخوض في التفاصيل. (فكرتك حول ما يعنيه ذلك جيدة مثل فكرتي.)
سألت Philomin إذا كان لديه المزيد من التفاصيل لمشاركتها حول كيفية تشكيل Titan Image Generator.
عندما ظهر النموذج لأول مرة في نوفمبر الماضي، لم تكن AWS متأكدة من البيانات التي كانت تستخدمها لتدريب Titan Image Generator. قليل من البائعين يكشفون عن مثل هذه المعلومات بسهولة؛ إنهم ينظرون إلى بيانات التدريب على أنها ميزة تنافسية، وبالتالي يحتفظون بها وبالمعلومات المتعلقة بها بالقرب من صدورهم.
وتشكل تفاصيل بيانات التدريب أيضًا مصدرًا محتملاً للدعاوى القضائية المتعلقة بالملكية الفكرية، الأمر الذي لا يشجع أيضًا على الكشف عن الكثير. ترفض العديد من قضايا المحاكم دفاعات الاستخدام العادل للبائعين، بحجة أن أدوات تحويل النص إلى صورة تعيد إنتاج أنماط الفنانين دون الحصول على إذن صريح من الفنانين وتسمح للمستخدمين بإنشاء أعمال جديدة تشبه الفنانين الأصليين والتي لا يتلقى الفنانون أي مقابل مقابلها. .
سيخبرني Philomin فقط أن AWS تستخدم مجموعة من البيانات الخاصة والمرخصة.
وقال: “لدينا مجموعة من مصادر البيانات الخاصة، ولكننا نرخص أيضًا الكثير من البيانات”. “نحن في الواقع ندفع رسوم ترخيص لأصحاب حقوق الطبع والنشر لاستخدام بياناتهم، ولدينا عقود مع العديد منهم.
إنها أكثر تفصيلاً مما كانت عليه في نوفمبر. ولكن لدي شعور بأن إجابة فيلومين لن ترضي الجميع، وخاصة منشئي المحتوى وأخلاقيات الذكاء الاصطناعي الذين يدعون إلى قدر أكبر من الشفافية عندما يتعلق الأمر بتدريب نماذج الذكاء الاصطناعي التوليدية.
بدلاً من الشفافية، تقول AWS إنها ستستمر في تقديم خدمة سياسة التعويض والذي يغطي العملاء في حالة قيام نموذج Titan مثل Titan Image Generator بالتقيؤ (أي يبصق نسخة معكوسة) من مثال تدريبي يحتمل أن يكون محميًا بحقوق الطبع والنشر. (يقدم العديد من المنافسين، بما في ذلك ميكروسوفت وجوجل، سياسات مماثلة تغطي نماذج إنشاء الصور الخاصة بهم).
ولمواجهة تهديد أخلاقي ملح آخر – التزييف العميق – تقول AWS إن الصور التي تم إنشاؤها باستخدام Titan Image Generator ستكون مصحوبة، كما هو الحال في المعاينة، بعلامة مائية غير مرئية “مضادة للتلاعب”. يقول فيلومين إن العلامة المائية أصبحت أكثر مرونة في إصدار GA للضغط وتعديلات الصور الأخرى ومعالجتها.
وبالانتقال إلى منطقة أقل إثارة للجدل، سألت فيلومين عما إذا كانت AWS – مثل Google وOpenAI وغيرهما – تستكشف إنشاء الفيديو نظرًا للحماس (والاستثمار في) التكنولوجيا. ولم يقل فيلومين أن AWS لم يكن ذلك… لكنه لم يرد أن يقول أي شيء أكثر من ذلك.
وقال فيلومين: “من الواضح أننا نتطلع دائمًا لمعرفة القدرات الجديدة التي يرغب العملاء في الحصول عليها، ومن المؤكد أن إنشاء الفيديو يظهر في محادثات العملاء”. “أود أن أطلب منك أن تبقى على اطلاع.”
في جزء أخير من الأخبار المتعلقة بـ Titan، أصدرت AWS الجيل الثاني من نموذج Titan Embeddings، Titan Text Embeddings V2. يقوم Titan Text Embeddings V2 بتحويل النص إلى تمثيلات رقمية تسمى التضمينات لتشغيل تطبيقات البحث والتخصيص. كان الأمر نفسه صحيحًا بالنسبة للجيل الأول من نموذج Embeddings، لكن AWS تدعي أن Titan Text Embeddings V2 أكثر كفاءة، وأكثر فعالية من حيث التكلفة، وأكثر دقة بشكل عام.
“يقلل نموذج Embeddings V2 من سعة التخزين الإجمالية (المطلوبة لاستخدام النموذج) بما يصل إلى أربع مرات مع الحفاظ على 97% من الدقة،” كما ادعى Philomin، “متفوقًا على النماذج المماثلة الأخرى.”
سنرى ما إذا كان الاختبار الفعلي سيثبت ذلك.
Source link