
Partnering with BCG
Delivering enterprise ready voice agents across industries
लंदन, यूनाइटेड किंगडम– ElevenLabs, दुनिया की अग्रणी AI वॉइस सॉफ्टवेयर कंपनी, ने आज एक नया मल्टी-लिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया है, जो 30 भाषाओं में 'इमोशन से भरपूर' AI ऑडियो बना सकता है।
यह पूरी तरह हमारी खुद की रिसर्च पर आधारित है, जिससे डेवलपर्स अब यूरोप, एशिया और मिडिल ईस्ट के इंटरनेशनल मार्केट्स के लिए लोकलाइज़्ड ऑडियो कंटेंट बना सकते हैं। पिछले 18 महीनों में ElevenLabs ने इंसानी भाषा के पैटर्न्स को समझा, स्पीच जनरेशन में कॉन्टेक्स्ट और इमोशन को बेहतर तरीके से लाने के नए तरीके बनाए और कई नई, अनोखी आवाज़ें सिंथेसाइज़ कीं।
Eleven Multilingual v2 के साथ हमारा नया मॉडल ElevenLabs की टेक्स्ट टू स्पीच प्लेटफॉर्म पर लगभग 30 लिखी जाने वाली भाषाओं को अपने आप पहचान सकता है और इन भाषाओं में पहले से कहीं ज्यादा असली जैसी आवाज़ में स्पीच बना सकता है।
चाहे आप सिंथेटिक या क्लोन की गई आवाज़ इस्तेमाल करें, हर भाषा में स्पीकर की यूनिक वॉइस क्वालिटी और ओरिजिनल एक्सेंट बरकरार रहता है। यानी एक ही आवाज़ में 30 अलग-अलग भाषाओं में कंटेंट सुनाया जा सकता है।
यह लॉन्च प्लेटफॉर्म पर सभी क्रिएटर्स के लिए Professional Voice Cloning के पब्लिक रिलीज के बाद आया है। इस प्रोडक्ट अपडेट के साथ, जो अतिरिक्त सुरक्षा फीचर्स के साथ आया है, यूज़र अपनी खुद की आवाज़ की एकदम सटीक डिजिटल कॉपी बना सकते हैं, जो
असली से लगभग अलग नहीं की जा सकती। आज के लॉन्च के साथ, आपकी आवाज़ अब लगभग 30 भाषाओं में बोल सकती है, जो इस मल्टी-लिंगुअल मॉडल में उपलब्ध हैं।
सपोर्टेड भाषाओं में शामिल हैं: कोरियन, डच, तुर्की, स्वीडिश, इंडोनेशियन, वियतनामी, फिलिपीनो, यूक्रेनियन, ग्रीक, चेक, फिनिश, रोमानियन, डेनिश, बुल्गेरियन, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियन, अरबी (स्टैंडर्ड) और तमिल। ये भाषाएं पहले से उपलब्ध अंग्रेज़ी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटैलियन, हिंदी और पुर्तगाली के साथ जुड़ती हैं।
नई सुविधाओं के लॉन्च और प्लेटफॉर्म में लगातार सुधार के बाद ElevenLabs ने आज पुष्टि की है कि प्लेटफॉर्म ने आधिकारिक तौर पर बीटा फेज़ छोड़ दिया है। यह बदलाव हमारे 1 मिलियन से ज्यादा यूज़र्स को भरोसेमंद और एडवांस टूल्स देने के हमारे वादे का अहम पड़ाव है।
आगे चलकर ElevenLabs एक ऐसा फीचर लाने की योजना बना रहा है, जिससे यूज़र अपनी आवाज़ें प्लेटफॉर्म पर शेयर कर सकें और नई ऑडियो डाटा के विकास से फायदा उठा सकें, ताकि इंसान और AI के बीच सहयोग और बढ़े।
Mati Staniszewski, ElevenLabs के सीईओ और फाउंडर ने कहा:
“ElevenLabs की शुरुआत इस सपने के साथ हुई थी कि हर कंटेंट हर भाषा और हर आवाज़ में सबके लिए उपलब्ध हो। Eleven Multilingual v2 के लॉन्च के साथ हम इस सपने के और करीब आ गए हैं और अब हर डायलैक्ट में इंसान जैसी क्वालिटी की AI वॉइस उपलब्ध करा रहे हैं।
हमारे वॉइस सिंथेसिस टूल्स हर क्रिएटर के लिए रास्ता खोलते हैं और उन्हें हाई-क्वालिटी वॉइस सिंथेसिस के विकल्प देते हैं। अब ये फायदे लगभग 30 भाषाओं में मल्टी-लिंगुअल एप्लिकेशन तक पहुंच गए हैं। आगे हम AI की मदद से और भी ज्यादा भाषाओं और आवाज़ों को जोड़ना चाहते हैं, ताकि कंटेंट के लिए भाषा की दीवारें खत्म हों। ElevenLabs में हम मानते हैं कि ऐसी पहुंच बढ़ने से आखिरकार ज्यादा क्रिएटिविटी, इनोवेशन और विविधता आएगी।”
ElevenLabs उन लागतों और संसाधनों को कम करता है, जो कई भाषाओं में हाई-क्वालिटी ऑडियो कंटेंट बनाने में लगते हैं। कंपनियां और क्रिएटर्स अब और ज्यादा इनोवेटिव और आसानी से पहुंचने वाला कंटेंट बना सकते हैं, जो अलग-अलग संस्कृतियों और भाषाओं के लोगों को जोड़ता है।
स्वतंत्र गेम डेवलपर्स और पब्लिशर्स के लिए यह मल्टी-लिंगुअल वॉइस जनरेशन टूल नए मौके खोलता है, जिससे वे इंटरनेशनल ऑडियंस के लिए गेम एक्सपीरियंस और ऑडियो कंटेंट ट्रांसलेट कर सकते हैं और खिलाड़ियों व श्रोताओं से उनकी अपनी भाषा में जुड़ सकते हैं, वो भी वॉइस क्वालिटी या सटीकता से समझौता किए बिना।
इसी तरह शैक्षिक संस्थानों के पास अब यह विकल्प है कि वे छात्रों को तुरंत उनकी टारगेट भाषा में सटीक ऑडियो कंटेंट दें, जिससे भाषा समझने और उच्चारण में सुधार हो और इंटरनेशनल छात्रों की अलग-अलग पढ़ाई की जरूरतों को पूरा किया जा सके।
हर तरह के क्रिएटर्स ElevenLabs के टूल का इस्तेमाल कर सकते हैं, ताकि उनकी कंटेंट की पहुंच दृष्टिबाधित या अतिरिक्त सीखने की जरूरत वाले लोगों तक बढ़ाई जा सके, और विज़ुअल कंटेंट को कई भाषाओं में वॉइस के साथ और समृद्ध बनाया जा सके।
जनवरी 2023 में पेश की गई हमारी पहली AI वॉइस टूल्स की सीरीज़ किसी भी टेक्स्ट को वॉइस में बदलने की सुविधा देती है, जिसमें कई प्री-डिफाइंड सिंथेटिक वॉइस चुनने और अपनी खुद की आवाज़ का क्लोन बनाने का विकल्प है। मल्टी-लिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के उस मिशन की अगली कड़ी है, जिसमें हर कंटेंट को हर भाषा और हर आवाज़ में सबके लिए उपलब्ध बनाना है।
यह टेक्नोलॉजी पहले से ही कई क्रिएटिव इंडस्ट्रीज़ और सेक्टर्स में इस्तेमाल हो रही है। इससे स्वतंत्र लेखक ऑडियोबुक बना सकते हैं, वीडियो गेम्स के साइड कैरेक्टर्स को आवाज़ दे सकते हैं, दृष्टिबाधित लोगों को ऑनलाइन लिखित कंटेंट सुनने में मदद मिलती है और दुनिया का पहला AI रेडियो स्टेशन चलाया जा सकता है। ElevenLabs ने कई अग्रणी कंटेंट क्रिएटर्स और स्टूडियोज़ के साथ साझेदारी भी की है, जिनमें AI वीडियो जनरेटर D-ID, Storytel, दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक, ओपन-एक्सेस वीडियो प्लेटफॉर्म ScienceCast, जिसका वीडियो जनरेशन टूल साइंटिफिक रिसर्च पेपर्स को एकत्र करता है, जो arXiv पर प्रकाशित हुए हैं, दुनिया का अग्रणी कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishing, शानदार गेम डेवलपर्स जैसे Embark Studios और Paradox Interactive और मीडिया प्लेटफॉर्म MNTN.

Delivering enterprise ready voice agents across industries

Doubling lead-to-lock conversion rate and reducing origination costs by 41%.