
ElevenLabs and Deutsche Telekom unveil the world’s first network-integrated AI call assistant
Bringing real-time AI assistance and translation to any phone call, on any device.
लंदन, यूनाइटेड किंगडम– ElevenLabs, दुनिया की अग्रणी AI वॉइस सॉफ्टवेयर कंपनी, ने आज एक नया मल्टी-लिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया है, जो 30 भाषाओं में 'इमोशन से भरपूर' AI ऑडियो बना सकता है।
यह पूरी तरह हमारी खुद की रिसर्च पर आधारित है, जिससे डेवलपर्स अब यूरोप, एशिया और मिडिल ईस्ट के इंटरनेशनल मार्केट्स के लिए लोकलाइज़्ड ऑडियो कंटेंट बना सकते हैं। पिछले 18 महीनों में ElevenLabs ने इंसानी भाषा के पैटर्न्स को समझा, स्पीच जनरेशन में कॉन्टेक्स्ट और इमोशन को बेहतर तरीके से लाने के नए तरीके बनाए और कई नई, अनोखी आवाज़ें सिंथेसाइज़ कीं।
Eleven Multilingual v2 के साथ हमारा नया मॉडल ElevenLabs की टेक्स्ट टू स्पीच प्लेटफॉर्म पर लगभग 30 लिखी जाने वाली भाषाओं को अपने आप पहचान सकता है और इन भाषाओं में पहले से कहीं ज्यादा असली जैसी आवाज़ में स्पीच बना सकता है।
चाहे आप सिंथेटिक या क्लोन की गई आवाज़ इस्तेमाल करें, हर भाषा में स्पीकर की यूनिक वॉइस क्वालिटी और ओरिजिनल एक्सेंट बरकरार रहता है। यानी एक ही आवाज़ में 30 अलग-अलग भाषाओं में कंटेंट सुनाया जा सकता है।
यह लॉन्च प्लेटफॉर्म पर सभी क्रिएटर्स के लिए Professional Voice Cloning के पब्लिक रिलीज के बाद आया है। इस प्रोडक्ट अपडेट के साथ, जो अतिरिक्त सुरक्षा फीचर्स के साथ आया है, यूज़र अपनी खुद की आवाज़ की एकदम सटीक डिजिटल कॉपी बना सकते हैं, जो
असली से लगभग अलग नहीं की जा सकती। आज के लॉन्च के साथ, आपकी आवाज़ अब लगभग 30 भाषाओं में बोल सकती है, जो इस मल्टी-लिंगुअल मॉडल में उपलब्ध हैं।
सपोर्टेड भाषाओं में शामिल हैं: कोरियन, डच, तुर्की, स्वीडिश, इंडोनेशियन, वियतनामी, फिलिपीनो, यूक्रेनियन, ग्रीक, चेक, फिनिश, रोमानियन, डेनिश, बुल्गेरियन, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियन, अरबी (स्टैंडर्ड) और तमिल। ये भाषाएं पहले से उपलब्ध अंग्रेज़ी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटैलियन, हिंदी और पुर्तगाली के साथ जुड़ती हैं।
नई सुविधाओं के लॉन्च और प्लेटफॉर्म में लगातार सुधार के बाद ElevenLabs ने आज पुष्टि की है कि प्लेटफॉर्म ने आधिकारिक तौर पर बीटा फेज़ छोड़ दिया है। यह बदलाव हमारे 1 मिलियन से ज्यादा यूज़र्स को भरोसेमंद और एडवांस टूल्स देने के हमारे वादे का अहम पड़ाव है।
आगे चलकर ElevenLabs एक ऐसा फीचर लाने की योजना बना रहा है, जिससे यूज़र अपनी आवाज़ें प्लेटफॉर्म पर शेयर कर सकें और नई ऑडियो डाटा के विकास से फायदा उठा सकें, ताकि इंसान और AI के बीच सहयोग और बढ़े।
Mati Staniszewski, ElevenLabs के सीईओ और फाउंडर ने कहा:
“ElevenLabs की शुरुआत इस सपने के साथ हुई थी कि हर कंटेंट हर भाषा और हर आवाज़ में सबके लिए उपलब्ध हो। Eleven Multilingual v2 के लॉन्च के साथ हम इस सपने के और करीब आ गए हैं और अब हर डायलैक्ट में इंसान जैसी क्वालिटी की AI वॉइस उपलब्ध करा रहे हैं।
हमारे वॉइस सिंथेसिस टूल्स हर क्रिएटर के लिए रास्ता खोलते हैं और उन्हें हाई-क्वालिटी वॉइस सिंथेसिस के विकल्प देते हैं। अब ये फायदे लगभग 30 भाषाओं में मल्टी-लिंगुअल एप्लिकेशन तक पहुंच गए हैं। आगे हम AI की मदद से और भी ज्यादा भाषाओं और आवाज़ों को जोड़ना चाहते हैं, ताकि कंटेंट के लिए भाषा की दीवारें खत्म हों। ElevenLabs में हम मानते हैं कि ऐसी पहुंच बढ़ने से आखिरकार ज्यादा क्रिएटिविटी, इनोवेशन और विविधता आएगी।”
ElevenLabs उन लागतों और संसाधनों को कम करता है, जो कई भाषाओं में हाई-क्वालिटी ऑडियो कंटेंट बनाने में लगते हैं। कंपनियां और क्रिएटर्स अब और ज्यादा इनोवेटिव और आसानी से पहुंचने वाला कंटेंट बना सकते हैं, जो अलग-अलग संस्कृतियों और भाषाओं के लोगों को जोड़ता है।
स्वतंत्र गेम डेवलपर्स और पब्लिशर्स के लिए यह मल्टी-लिंगुअल वॉइस जनरेशन टूल नए मौके खोलता है, जिससे वे इंटरनेशनल ऑडियंस के लिए गेम एक्सपीरियंस और ऑडियो कंटेंट ट्रांसलेट कर सकते हैं और खिलाड़ियों व श्रोताओं से उनकी अपनी भाषा में जुड़ सकते हैं, वो भी वॉइस क्वालिटी या सटीकता से समझौता किए बिना।
इसी तरह शैक्षिक संस्थानों के पास अब यह विकल्प है कि वे छात्रों को तुरंत उनकी टारगेट भाषा में सटीक ऑडियो कंटेंट दें, जिससे भाषा समझने और उच्चारण में सुधार हो और इंटरनेशनल छात्रों की अलग-अलग पढ़ाई की जरूरतों को पूरा किया जा सके।
हर तरह के क्रिएटर्स ElevenLabs के टूल का इस्तेमाल कर सकते हैं, ताकि उनकी कंटेंट की पहुंच दृष्टिबाधित या अतिरिक्त सीखने की जरूरत वाले लोगों तक बढ़ाई जा सके, और विज़ुअल कंटेंट को कई भाषाओं में वॉइस के साथ और समृद्ध बनाया जा सके।
जनवरी 2023 में पेश की गई हमारी पहली AI वॉइस टूल्स की सीरीज़ किसी भी टेक्स्ट को वॉइस में बदलने की सुविधा देती है, जिसमें कई प्री-डिफाइंड सिंथेटिक वॉइस चुनने और अपनी खुद की आवाज़ का क्लोन बनाने का विकल्प है। मल्टी-लिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के उस मिशन की अगली कड़ी है, जिसमें हर कंटेंट को हर भाषा और हर आवाज़ में सबके लिए उपलब्ध बनाना है।
यह टेक्नोलॉजी पहले से ही कई क्रिएटिव इंडस्ट्रीज़ और सेक्टर्स में इस्तेमाल हो रही है। इससे स्वतंत्र लेखक ऑडियोबुक बना सकते हैं, वीडियो गेम्स के साइड कैरेक्टर्स को आवाज़ दे सकते हैं, दृष्टिबाधित लोगों को ऑनलाइन लिखित कंटेंट सुनने में मदद मिलती है और दुनिया का पहला AI रेडियो स्टेशन चलाया जा सकता है। ElevenLabs ने कई अग्रणी कंटेंट क्रिएटर्स और स्टूडियोज़ के साथ साझेदारी भी की है, जिनमें AI वीडियो जनरेटर D-ID, Storytel, दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक, ओपन-एक्सेस वीडियो प्लेटफॉर्म ScienceCast, जिसका वीडियो जनरेशन टूल साइंटिफिक रिसर्च पेपर्स को एकत्र करता है, जो arXiv पर प्रकाशित हुए हैं, दुनिया का अग्रणी कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishingशानदार गेम डेवलपर्स जैसे Embark Studiosऔर Paradox Interactiveऔर मीडिया प्लेटफॉर्म MNTN.

Bringing real-time AI assistance and translation to any phone call, on any device.

AI is changing how marketing teams produce content.