يخرج ElevenLabs من الإصدار التجريبي ويصدر Eleven Multilingual v2 - وهو نموذج أساسي للكلام بالذكاء الاصطناعي لـ 30 لغة

  • تتخذ منصة الذكاء الاصطناعي الصوتي ElevenLabs قفزة جذرية إلى الأمام في جهودها للقضاء على الحواجز اللغوية للمحتوى، مع إصدار نموذج تعلم عميق تأسيسي جديد يدعم القدرات متعددة اللغات عبر 30 لغة - Eleven Multilingual v2
  • سيسمح التقدم لشركات الإعلام ومطوري الألعاب والناشرين والمبدعين المستقلين في جميع أنحاء العالم بتحسين إمكانية الوصول إلى محتواهم بشكل كبير
  • تمثل هذه القدرات الجديدة، التي تتبع مجموعة من إصدارات الميزات والتحسينات الجديدة منذ إطلاق المنصة في يناير، النهاية الرسمية للمرحلة التجريبية للشركة
  • تتمثل مهمة ElevenLabs في جعل جميع المحتوى متاحًا عالميًا بأي لغة وبأي صوت

لندن، المملكة المتحدة - أطلقت ElevenLabs، الشركة الرائدة عالميًا في برامج الذكاء الاصطناعي الصوتي، اليوم نموذجًا جديدًا لتوليد الصوت متعدد اللغات قادر على إنتاج صوت ذكاء اصطناعي يتميز "بالغنى العاطفي" الدقيق في 30 لغة.

وسيتيح التقدم، القائم بالكامل على الأبحاث الداخلية، للمبدعين إنتاج محتوى صوتي محلي للأسواق الدولية في جميع أنحاء أوروبا وآسيا والشرق الأوسط. أمضى ElevenLabs الأشهر الثمانية عشر الماضية في تحليل علامات الكلام البشري، وبناء آليات جديدة لفهم السياق ونقل العواطف في توليد الكلام، بالإضافة إلى تجميع أصوات جديدة وفريدة من نوعها.

يتيح نموذج Eleven Multilingual v2 الجديد، عند إدخال النص في منصة ElevenLabs لتحويل النص إلى كلام، إمكانية تحديد ما يقرب من 30 لغة مكتوبة تلقائيًا وتوليد الكلام فيها بمستوى غير مسبوق من الأصالة.

وفي الوقت نفسه، بغض النظر إن كان الصوت المستخدم صوتُا اصطناعيًا أو صوتًا مستنسخًا، سيتم الحفاظ على خصائص الصوت الفريدة للمتحدث عبر جميع اللغات، بما في ذلك لهجته الأصلية. وهذا يعني إن بالإمكان استخدام الصوت نفسه لإضفاء الحيوية على المحتوى عبر 30 لغة منفصلة.

يتبع هذا النشر الإصدار العام للاستنساخ الصوتي الاحترافي لجميع منشئي المحتوى على المنصة. يتيح تحديث المنتج هذا، الذي أُصدر جنبًا إلى جنب مع ميزات السلامة والأمان الإضافية، للمستخدمين إنشاء نسخة رقمية مثالية من صوتهم؛ نسخة افتراضية

ولا يمكن تمييزها عن الأصل. إن إصدار اليوم يعني تمتّع صوتك بالقدرة على التحدث عبر ما يقرب من 30 لغة يقدمها النموذج متعدد اللغات.

تشمل اللغات المدعومة؛ الكورية والهولندية والتركية والسويدية والإندونيسية والفيتنامية والفلبينية والأوكرانية واليونانية والتشيكية والفنلندية والرومانية والدنماركية والبلغارية والماليزية والمجرية والنرويجية والسلوفاكية والكرواتية والعربية الكلاسيكية والتاميلية. وقد انضمت إلى اللغات المتاحة سابقًا بما في ذلك الإنجليزية والبولندية والألمانية والإسبانية والفرنسية والإيطالية والهندية والبرتغالية.

كما أكّد ElevenLabs، عد إطلاق الميزات الأخيرة والتحسينات المستمرة للمنصة، اليوم أن المنصة ستخرج رسميًا من الإصدار التجريبي. ويمثل هذا الانتقال لحظة محورية في تفاني الشركة لتوفير أدوات موثوقة ومتطورة لمستخدميها العالميين الذين يزيد عددهم عن مليون مستخدم.

وتخطط ElevenLabs، من خلال استشراف المستقبل، لتقديم آلية تتيح للمستخدمين مشاركة الأصوات على المنصة والاستفادة من تطوير صوت جديد، مما يعزز فرص التعاون بين الإنسان والذكاء الاصطناعي.

وقد علّق ماتي ستانيسزفسكي، الرئيس التنفيذي والمؤسس المشارك لشركة ElevenLabs، قائلًا:

"بدأ ElevenLabs بحلم جعل جميع المحتوى متاحًا عالميًا بأي لغة وبأي صوت. أتاح لنا إصدار Eleven Multilingual v2، الاقتراب خطوة واحدة من تحويل هذا الحلم إلى حقيقة واقعة وجعل أصوات الذكاء الاصطناعي ذات الجودة البشرية متاحة في كل لهجة.

"تساعد أدواتنا لتوليد النص إلى كلام على تكافؤ الفرص وتقديم قدرات صوتية منطوقة عالية الجودة لجميع منشئي المحتوى. وتمتد هذه الفوائد الآن إلى التطبيقات متعددة اللغات عبر ما يقرب من 30 لغة. نأمل في النهاية أن نغطي المزيد من اللغات والأصوات بمساعدة الذكاء الاصطناعي، وأن نزيل الحواجز اللغوية أمام المحتوى. نعتقد في ElevenLabs، أن هذه القفزات في إمكانية الوصول ستعزز في النهاية قدرًا أكبر من الإبداع والابتكار والتنوع".

من خلال خفض التكلفة والموارد اللازمة لإنشاء محتوى صوتي عالي الجودة بلغات متعددة، يوفّر ElevenLabs للشركات والمبدعين إمكانية إنتاج محتوى أكثر إبداعًا ويمكن الوصول إليه يتردد صداه عبر الثقافات واللغات.

توفر أداة إنشاء الكلام متعددة اللغات لمطوري الألعاب والناشرين المستقلين، فرصًا جديدة لترجمة تجارب الألعاب والمحتوى الصوتي للجماهير الدولية، والتواصل مع اللاعبين والمستمعين بلغاتهم الخاصة دون المساومة على جودة أو دقة الصوت المنطوق.

وبالمثل، تمتلك المؤسسات التعليمية الآن الوسائل اللازمة لتزويد المتعلمين بمحتوى صوتي دقيق باللغات المستهدفة على الفور، مما يعزز مهارات فهم اللغة ونطقها، بالإضافة إلى تلبية أساليب التدريس المختلفة واحتياجات التعلم للطلاب الدوليين.

يمكن للمبدعين من جميع الأنواع استخدام أداة ElevenLabs لتحسين إمكانية الوصول إلى المحتوى للأشخاص من ذوي الإعاقات البصرية أو احتياجات التعلم الإضافية من خلال استكمال المحتوى المرئي بالكلام المتاح بلغات متعددة.

تضمنت مجموعتها الأولية من الأدوات الصوتية للذكاء الاصطناعي التي كُشف عنها في يناير 2023 القدرة على تحويل أي نص إلى كلام عبر مجموعة مختارة من الأصوات الاصطناعية المصممة مسبقًا والقدرة على إنشاء نسخة من صوتك. تعد أداة توليف الكلام متعددة اللغات خطوة أخرى إلى الأمام في مهمة ElevenLabs لجعل جميع المحتوى متاحًا عالميًا بأي لغة وبأي صوت.

وقد تبنت العديد من القطاعات والقطاعات الإبداعية بالفعل هذه التكنولوجيا، بما في ذلك تمكين المؤلفين المستقلين من إنشاء كتب صوتية، والتعبير عن الشخصيات الثانوية في ألعاب الفيديو، ودعم ضعاف البصر للوصول إلى المحتوى المكتوب عبر الإنترنت، وتشغيل أول قناة إذاعية للذكاء الاصطناعي في العالم. كما عقدت ElevenLabs شراكة مع مجموعة من منشئي المحتوى والاستوديوهات الرائدة، بما في ذلك مولدات الفيديو بالذكاء الاصطناعي D-ID، وهي واحدة من أكبر ناشري الكتب الصوتية في العالم Storytel، ومنصة الفيديو العلمية مفتوحة الوصول ScienceCast التي تكثف أداة إنشاء الفيديو الخاصة بها أوراق البحث العلمي المنشورة على arXiv، ومنصة منشئي المحتوى العالمية الرائدة TheSoul Publishing ، ومطوري الألعاب المذهلين مثل Embark Studios وParadox Interactive، ومنصةMNTN الإعلامية.

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in