يتعاون Pocket FM مع ElevenLabs لتحويل البرامج النصية بسرعة إلى محتوى صوتي

Maywiltech20/06/2024

0 3 3 دقائق

الأعمال الخفيفة السرعةمنصة الصوت المدعومة جيب إف إم أعلنت للتو عن شراكتها مع شركة استنساخ الصوت أحد عشر مختبرًا لتحويل المحتوى النصي بسرعة، مثل البرنامج النصي، إلى سلسلة صوتية باستخدام الذكاء الاصطناعي.

جيب إف إمما أثار 103 ملايين دولار من تمويل السلسلة D في مارس، أخبرت TechCrunch في ذلك الوقت أنها كانت تقوم بالفعل بتجربة القدرة على تحويل محتوى النص إلى صوت باستخدام تقنية ElevenLabs. والآن، قامت الشركة التي يقع مقرها في الهند بتوسيع شراكتها لجعل أداة التحويل متاحة لجميع منشئي المحتوى في الأسابيع المقبلة.

في مرحلة الاختبار، أنتج Pocket FM بالفعل 30 ألف ساعة من السلسلة الصوتية باستخدام تقنية الذكاء الاصطناعي الخاصة بـ ElevenLab. ومن خلال هذا الإصدار الجديد، تخطط الشركة الناشئة لمضاعفة مكتبة المحتوى الخاصة بها ثلاث مرات والتي تزيد عن 100000 ساعة من المحتوى الصوتي هذا العام. قال Pocket FM أيضًا أنه خلال المرحلة التجريبية، ساعدته الأدوات المستندة إلى الذكاء الاصطناعي على تقليل تكلفة إنتاج الصوت بنسبة 90٪.

اعتمادات الصورة: جيب إف إم

أخبر المؤسس المشارك لـ Pocket FM والمدير التنفيذي للتكنولوجيا Prateek Dixit موقع TechCrunch في مكالمة هاتفية أنه من خلال هذه الشراكة، تريد الشركة أن تسهل على الكتاب تحويل كتاباتهم إلى سلسلة صوتية.

وقال: “لدينا أكثر من 250 ألف كاتب (بما في ذلك أولئك الموجودون على منصة كتابة الروايات الجيبية التابعة للشركة) وهذه الشراكة تقلل من تكاليف الإعداد والتسجيل الصوتي لهم”.

“حتى مع الإعداد الجيد لأدوات ومعدات التسجيل، يمكن للكتاب إنتاج حوالي 30 دقيقة من المحتوى الصوتي عالي الجودة يوميًا. وباستخدام أدوات الذكاء الاصطناعي، يمكن أن تكون هذه النتيجة أعلى بعشر مرات.

قام Pocket FM ببناء أداة تتضمن تقنية ElevenLabs، والتي من خلالها تقدم 50 صوتًا للكتاب الذين يرغبون في تحويل المحتوى الخاص بهم. وقال ماتي ستانيشفسكي، المؤسس المشارك لشركة ElevenLabs، إن أداة شركته تفهم سياق الكتابة وتستنتج المشاعر تلقائيًا من خلال الصوت.

وقال ستانيزيفسكي: “من خلال العمل مع Pocket FM، فإننا نطرح نماذجنا الجديدة التي تفهم نوع الكتابة وتكون أفضل من حيث العاطفة”.

وأشار ديكسيت إلى أنه بناءً على البيانات المتعلقة بتفاعل المستخدم مع هذا النوع من المحتوى، تخطط المنصة أيضًا لاقتراح الأصوات التي تعمل بشكل جيد للكتاب في نوع معين.

لا يعد Pocket FM النظام الأساسي الوحيد للسلسلة الصوتية الذي يقوم بتجربة الأدوات المستندة إلى الذكاء الاصطناعي. Kuku FM مدعوم من جوجل يستخدم GPT-4، وClaude، وBandLab، وحتى ElevenLabs لمساعدة كتابه في مراحل مختلفة من الإنشاء، بما في ذلك تحسين النص وإنشاء صور مصغرة وإضافة مؤثرات صوتية وتحويل النص إلى صوت.

أخبرت Kuku FM موقع TechCrunch أنها تقوم أيضًا بتجربة استخدام أدوات الإنشاء المرئي مثل MidJourney وRunway لإنشاء إعلانات ذات صلة بالمحتوى.

جودة المحتوى وتأثيره على الفنانين

إن الوعد الذي توفره الأدوات التي تعمل بالذكاء الاصطناعي هو إنشاء المزيد من المحتوى بشكل أسرع، ولكن هذا لا يعني أن المحتوى جيد. تتمثل إجابة Pocket FM لتسهيل الاكتشاف وإظهار المحتوى عالي الجودة في جعل خوارزمية الاكتشاف الخاصة به متطورة وتجربة تفاعل المستخدم.

“إذا نشر الكاتب سلسلة صوتية، فإننا نقدم هذا المحتوى لعدد محدد من المستخدمين ونراقب مقاييس التفاعل. وقال ديكسيت: “إذا كانت هذه الإجراءات إيجابية، فإننا ننشرها على نطاق أوسع”.

يمكن أن يؤدي استخدام الذكاء الاصطناعي إلى نتائج أسرع ومكتبة أكبر من المحتوى لهذه المنصات، ولكنه قد يقلل أيضًا من دور فناني التعليق الصوتي الذين يعملون معهم. أعربت جمعية فناني التعليق الصوتي الهندي (AVA) عن مخاوفها بشأن ظهور الذكاء الاصطناعي.

“إذا تولى الذكاء الاصطناعي المسؤولية، فسينتهي الأمر. “باعتبارنا فنانين صوتيين، نحتاج إلى وضع بعض القواعد التنظيمية حتى يتم حماية سبل عيشنا”، قال أماريندر سينغ سودهي، الأمين العام للجمعية. قال للنشر الهندي Scroll.

تحدث Sodi أيضًا إلى Scroll حول الحوادث التي تم فيها استدعاء فناني التعليق الصوتي إلى الاستوديو لتسجيل عينات لتدريب الذكاء الاصطناعي دون الحصول على موافقتهم أو إبلاغهم.

“على المستوى العاطفي، هذا يخيفني. باستخدام الذكاء الاصطناعي، فإنك تضعف بشكل أساسي التجربة الإنسانية في رواية القصص. تفقد الاتصال العاطفي. صرح أديتيا ماتو، فنان التعليق الصوتي المقيم في دلهي، لـ TechCrunch.

وأضاف أن إتاحة الوصول إلى الأصوات المتميزة للأشخاص الذين لم يطوروا الذوق والمهارات اللازمة لإنتاج محتوى عالي الجودة سيؤدي إلى إغراق السوق بمحتوى سيء.

عندما سألنا عن تأثير توليد الصوت المعتمد على الذكاء الاصطناعي على Pocket FM، لم تجب الشركة على السؤال مباشرة. ومع ذلك، أشار ديكسيت إلى أن التفاعل مع المحتوى الناتج عن الذكاء الاصطناعي في تجاربه “جيد مثل إنتاج تعليقات صوتية بشرية”. والجدير بالذكر أن الشركة تعمل أيضًا على تقنية لدمج أصوات متعددة في مخرج صوتي واحد.

لا يقوم Pocket FM وKuku FM حاليًا بوضع علامة على محتواهما للإشارة إلى ما إذا كان الذكاء الاصطناعي قد تم استخدامه في عملية الإنشاء.

Source link

Maywiltech20/06/2024

0 3 3 دقائق