
ElevenLabs and Deutsche Telekom unveil the world’s first network-integrated AI call assistant
Bringing real-time AI assistance and translation to any phone call, on any device.
यूके लंदन - वॉइस AI सॉफ़्टवेयर के क्षेत्र में एक वैश्विक नेता ElevenLabsने आज 'भावनात्मक रूप से समृद्ध' AI ऑडियो को सटीक रूप से उत्पन्न करने में सक्षम 30 भाषाओं में एक नया बहुभाषी वॉइस जनरेशन मॉडल लॉन्च किया।
पूरी तरह से अपनी रिसर्च पर आधारित इस कदम से क्रिएटर्स यूरोप, एशिया और मध्य पूर्व के अंतरराष्ट्रीय बाजारों को लक्षित कर स्थानीयकृत ऑडियो सामग्री बना सकते हैं। ElevenLabs ने पिछले 18 महीनों में मानव भाषण संकेतकों का विश्लेषण किया है, भाषण निर्माण में संदर्भ को समझने और भावनाओं को व्यक्त करने के लिए नए तंत्र बनाए हैं, और नई और अनोखी आवाज़ों का सिंथेसिस किया है।
Eleven Multilingual v2 के साथ, जब टेक्स्ट ElevenLabs टेक्स्ट टू स्पीच प्लेटफॉर्म में डाला जाता है, नया मॉडल लगभग 30 लिपि भाषाओं को स्वचालित रूप से पहचानता है और उस भाषा में अभूतपूर्व स्तर की प्रामाणिकता के साथ आवाज उत्पन्न कर सकता है।
साथ ही, चाहे सिंथेटिक वॉइस का उपयोग हो या क्लोन की गई आवाज़ का, वक्ता की अनूठी आवाज़ की विशेषताएं, मूल लहजे सहित, सभी भाषाओं में बनी रहती हैं। यानी, आप एक ही आवाज़ का उपयोग करके 30 भाषाओं में सामग्री को जीवंत बना सकते हैं।
यह वितरण प्लेटफॉर्म के सभी क्रिएटर्स के लिए Professional Voice Cloning के सार्वजनिक रूप से उपलब्ध होने के बाद आता है। अतिरिक्त सुरक्षा और सुरक्षा सुविधाओं के साथ लॉन्च किए गए इस प्रोडक्ट अपडेट के माध्यम से, उपयोगकर्ता अपनी आवाज़ की लगभग अप्रभेद्य डिजिटल
प्रतिलिपि बना सकते हैं। आज का रिलीज़ लगभग 30 भाषाओं में बहुभाषी मॉडल की आवाज़ों को उपलब्ध कराने का संकेत देता है।
समर्थित भाषाओं में कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बुल्गारियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, क्लासिकल अरबी और तमिल शामिल हैं। ये अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटालियन, हिंदी और पुर्तगाली जैसी पहले से उपलब्ध भाषाओं में शामिल हो गए हैं।
हाल के फीचर लॉन्च और प्लेटफॉर्म के निरंतर सुधार के बाद, ElevenLabs ने आज पुष्टि की कि प्लेटफॉर्म आधिकारिक तौर पर बीटा संस्करण में लॉन्च हो गया है। यह परिवर्तन 10 लाख से अधिक वैश्विक उपयोगकर्ताओं को विश्वसनीय अत्याधुनिक उपकरण प्रदान करने के लिए कंपनी की प्रतिबद्धता में एक महत्वपूर्ण क्षण का जश्न मनाता है।
आगे चलकर ElevenLabs उपयोगकर्ताओं को प्लेटफॉर्म पर आवाज़ें साझा करने और नई ऑडियो विकास के लाभों का आनंद लेने के लिए तंत्र पेश करके मानव-AI सहयोग के अवसरों को बढ़ावा देने की योजना बना रहा है।
ElevenLabs के सीईओ और सह-संस्थापक Mati Staniszewski कहते हैं:
“ElevenLabs का सपना था कि हर भाषा और आवाज़ में हर सामग्री तक सभी की पहुँच हो सके। Eleven Multilingual v2 के लॉन्च के साथ हम इस सपने को वास्तविकता में बदलने के लिए एक कदम और
“TTS (टेक्स्ट टू स्पीच) उत्पादन उपकरण खेल के मैदान को समान करते हैं और सभी क्रिएटर्स को उच्चतम गुणवत्ता की वॉइस ऑडियो क्षमताएं प्रदान करते हैं। ये फायदे अब लगभग 30 भाषाओं में बहुभाषी एप्लिकेशन के रूप में विस्तारित होते हैं। हम AI की मदद से अधिक भाषाओं और आवाज़ों को कवर करने और सामग्री के भाषाई बाधाओं को हटाने की
कई भाषाओं में उच्च गुणवत्ता वाली ऑडियो सामग्री बनाने की लागत और संसाधनों को कम करके ElevenLabs कंपनियों और क्रिएटर्स को अधिक कल्पनाशील और सुलभ सामग्री बनाने में मदद करता है जो संस्कृति और भाषा के पार सहानुभूति पैदा कर सके।
स्वतंत्र गेम डेवलपर्स और प्रकाशकों के लिए बहुभाषी वॉइस जनरेशन टूल्स अंतरराष्ट्रीय दर्शकों के लिए गेम अनुभव और ऑडियो सामग्री का अनुवाद करने के नए अवसर प्रदान करते हैं, जिससे वे अपनी भाषा में खिलाड़ियों और श्रोताओं से जुड़ सकते हैं बिना वॉइस ऑडियो की गुणवत्ता या सटीकता को प्रभावित किए।
इसी तरह, शैक्षणिक संस्थान अब शिक्षार्थियों को लक्षित भाषा में सटीक ऑडियो सामग्री तुरंत प्रदान कर सकते हैं, भाषा समझ और उच्चारण कौशल को मजबूत कर सकते हैं, और अंतरराष्ट्रीय छात्रों के लिए विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा कर सकते हैं।
सभी प्रकार के क्रिएटर्स ElevenLabs के टूल्स का उपयोग करके कई भाषाओं में उपलब्ध आवाज़ों के साथ दृश्य सामग्री को पूरक कर सकते हैं, जिससे दृष्टिबाधित या अतिरिक्त सीखने की आवश्यकता वाले लोगों के लिए सामग्री की पहुँच को बढ़ा सकते हैं।
जनवरी 2023 में जारी किए गए प्रारंभिक AI वॉइस टूल्स में पूर्व-डिज़ाइन किए गए सिंथेटिक वॉइस विकल्पों के माध्यम से किसी भी टेक्स्ट को आवाज़ में बदलने की क्षमता और अपनी आवाज़ की प्रतिलिपि बनाने की क्षमता शामिल थी। बहुभाषी वॉइस सिंथेसिस टूल्स ElevenLabs के मिशन के लिए एक और प्रगति है कि हर भाषा और आवाज़ में हर सामग्री तक सभी की पहुँच हो।
यह तकनीक पहले ही कई रचनात्मक क्षेत्रों और क्षेत्रों में अपनाई जा चुकी है, जिसमें इंडी लेखकों को ऑडियोबुक बनाने में सक्षम बनाना, वीडियो गेम में सहायक पात्रों को आवाज़ देना, दृष्टिबाधित लोगों को ऑनलाइन लिखित सामग्री तक पहुँच प्रदान करना, और दुनिया के पहले AI रेडियो चैनल को शक्ति प्रदान करना शामिल है। ElevenLabs ने AI वीडियो जनरेटर D-ID, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक Storytel, arXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को संक्षेपित करने वाला ओपन एक्सेस साइंस वीडियो प्लेटफॉर्म ScienceCast, प्रमुख वैश्विक सामग्री निर्माता प्लेटफॉर्म TheSoul पब्लिशिंग, Embark स्टूडियोज और पैराडॉक्स इंटरएक्टिव, जैसे अद्भुत गेम डेवलपर्स, मीडिया प्लेटफॉर्म MNTN सहित विभिन्न प्रमुख सामग्री निर्माताओं और स्टूडियो के साथ साझेदारी की है।

Bringing real-time AI assistance and translation to any phone call, on any device.

AI is changing how marketing teams produce content.