
Tony Robbins launches real-time AI coaching in his own voice with Steno.ai and ElevenLabs
An AI twin of the world’s #1 life and business strategist
लंदन, यूनाइटेड किंगडम - ElevenLabs, AI वॉइस सॉफ़्टवेयर में वैश्विक नेता, ने आज एक नया मल्टीलिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया जो 30 भाषाओं में 'भावनाओं से भरपूर' AI ध्वनियों को सटीकता से उत्पन्न करने में सक्षम है।
यह प्रगति, पूरी तरह से आंतरिक अनुसंधान पर आधारित है, क्रिएटर्स को यूरोप, एशिया और मध्य पूर्व के अंतरराष्ट्रीय बाजारों के लिए स्थानीयकृत ऑडियो कंटेंट बनाने की अनुमति देगी। ElevenLabs ने पिछले 18 महीनों में मानव भाषण की विशेषताओं का विश्लेषण करने, संदर्भ को समझने और भाषण जनरेशन में भावनाओं को व्यक्त करने के लिए नए तंत्र बनाने, और नई और अनूठी आवाज़ों को सिंथेसाइज़ करने में बिताया है।
Eleven Multilingual v2 के साथ, जब ElevenLabs के वॉइस सिंथेसिस प्लेटफॉर्म में एक टेक्स्ट डाला जाता है, तो नया मॉडल लगभग 30 लिखित भाषाओं की पहचान कर सकता है और उनमें अभूतपूर्व प्रामाणिकता के स्तर के साथ भाषण उत्पन्न कर सकता है।
इसके अलावा, चाहे वह सिंथेटिक आवाज़ हो या क्लोन की गई आवाज़, वक्ता की अनूठी विशेषताएं सभी भाषाओं में संरक्षित रहती हैं, जिसमें उसका मूल उच्चारण भी शामिल है। इस प्रकार, वही आवाज़ 30 विभिन्न भाषाओं में कंटेंट को जीवंत बनाने के लिए उपयोग की जा सकती है।
यह लॉन्च के बाद आता है प्लेटफॉर्म के सभी क्रिएटर्स के लिए पेशेवर वॉइस क्लोनिंग के लॉन्च के बाद। इस प्रोडक्ट अपडेट, जो अतिरिक्त सुरक्षा सुविधाओं के साथ लॉन्च किया गया था, यूज़र्स को अपनी खुद की आवाज़ की एक डिजिटल कॉपी बनाने की अनुमति देता है; जो लगभग
मूल से अलग करना असंभव है। इस नए संस्करण के साथ, आपकी आवाज़ लगभग 30 भाषाओं में मॉडल के मल्टीलिंगुअल संस्करण में व्यक्त हो सकेगी।
समर्थित भाषाओं में शामिल हैं: कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, अरबी और तमिल। ये पहले से उपलब्ध भाषाओं में शामिल हो रही हैं, जिनमें अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इतालवी, हिंदी और पुर्तगाली शामिल हैं।
हाल के फीचर लॉन्च और प्लेटफॉर्म के निरंतर सुधार के बाद, ElevenLabs ने आज यह भी पुष्टि की कि प्लेटफॉर्म आधिकारिक तौर पर अपने बीटा चरण से बाहर आ रहा है। यह परिवर्तन कंपनी की प्रतिबद्धता में एक महत्वपूर्ण मोड़ को चिह्नित करता है कि वह दुनिया भर में अपने एक मिलियन से अधिक यूज़र्स को विश्वसनीय और अत्याधुनिक उपकरण प्रदान करे।
भविष्य में, ElevenLabs उपयोगकर्ताओं को अपनी आवाज़ें प्लेटफॉर्म पर साझा करने और नए ध्वनियों के विकास से लाभ उठाने की अनुमति देने के लिए एक तंत्र पेश करने की योजना बना रहा है, जिससे मानव और AI के बीच सहयोग की संभावनाएं बढ़ेंगी।
माटी स्टानिस्ज़ेव्स्की, ElevenLabs के सीईओ और सह-संस्थापक, टिप्पणी करते हैं:
« ElevenLabs की स्थापना इस उद्देश्य से की गई थी कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाया जाए। Eleven Multilingual v2 की रिलीज़ के साथ, हम अपने लक्ष्य के और करीब आ रहे हैं, जो इस सपने को वास्तविकता बनाने और सभी बोलियों में मानव गुणवत्ता की AI आवाज़ें उपलब्ध कराने का है।
« हमारे वॉइस सिंथेसिस टूल्स सभी को समान स्तर पर लाते हैं और सभी क्रिएटर्स को उच्च गुणवत्ता वाली ऑडियो वॉइस क्षमताएं प्रदान करते हैं। ये लाभ अब लगभग 30 भाषाओं में मल्टीलिंगुअल एप्लिकेशनों तक विस्तारित हो गए हैं। अंततः, हम AI की मदद से और भी अधिक भाषाओं और आवाज़ों को कवर करने की उम्मीद करते हैं, और कंटेंट पर भाषाई बाधाओं को समाप्त करना चाहते हैं। ElevenLabs में, हमें विश्वास है कि ये प्रगति अंततः रचनात्मकता, नवाचार और विविधता को बढ़ावा देगी। »
कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, ElevenLabs कंपनियों और क्रिएटर्स को अधिक कल्पनाशील और सुलभ कंटेंट बनाने की अनुमति देता है जो सभी संस्कृतियों और भाषाओं को ध्यान में रखता है।
के लिए स्वतंत्र गेम डेवलपर्स और प्रकाशक, मल्टीलिंगुअल वॉइस जनरेशन टूल गेम अनुभवों और ऑडियो कंटेंट को अंतरराष्ट्रीय दर्शकों के लिए अनुवाद करने की अनुमति देता है, खिलाड़ियों और श्रोताओं के साथ उनकी अपनी भाषा में जुड़ने के लिए, बिना बोले गए ऑडियो की गुणवत्ता या सटीकता से समझौता किए।
इसी तरह, शैक्षणिक संस्थान अब शिक्षार्थियों को लक्षित भाषाओं में सटीक ऑडियो कंटेंट तुरंत प्रदान करने में सक्षम हैं, जिससे भाषा समझ और उच्चारण कौशल को मजबूत किया जा सके और अंतरराष्ट्रीय छात्रों की विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा किया जा सके।
सभी प्रकार के क्रिएटर्स ElevenLabs के टूल का उपयोग कर सकते हैं दृष्टिहीन लोगों या अतिरिक्त सीखने की आवश्यकताओं वाले लोगों के लिए कंटेंट की पहुंच को बढ़ाने के लिए, दृश्य कंटेंट को कई भाषाओं में उपलब्ध भाषण के साथ पूरक करके।
जनवरी 2023 में अनावरण किए गए अपने पहले AI वॉइस टूल्स सेट में किसी भी टेक्स्ट को पूर्व-निर्मित सिंथेटिक आवाज़ों के चयन के माध्यम से भाषण में बदलने की क्षमता और आपकी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। मल्टीलिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के मिशन में एक नया कदम है, जो सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाने के लिए है।
इस तकनीक को पहले ही कई क्षेत्रों और रचनात्मक वर्टिकल्स में अपनाया जा चुका है, जिसमें स्वतंत्र लेखकों को ऑडियोबुक बनाने में सक्षम बनाना, वीडियो गेम में सहायक पात्रों को आवाज़ देना, दृष्टिहीन लोगों को ऑनलाइन लिखित कंटेंट तक पहुंचने में मदद करना और दुनिया के पहले AI रेडियो चैनल को शक्ति देना शामिल है। ElevenLabs ने प्रमुख क्रिएटर्स और कंटेंट स्टूडियो की एक श्रृंखला के साथ भी साझेदारी की है, जिसमें AI वीडियो जनरेटर्स D-ID, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक , Storytel, खुले एक्सेस वैज्ञानिक वीडियो प्लेटफॉर्म ScienceCast जिसका वीडियो जनरेशन टूल arXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को एकत्र करता है, दुनिया की प्रमुख कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishing, अद्भुत गेम डेवलपर्स जैसे Embark Studios और Paradox Interactive, और मल्टीमीडिया प्लेटफॉर्म MNTN.
An AI twin of the world’s #1 life and business strategist
Recruitment Voice AI agents that boost engagement, and drive 95% call completion rates.
ElevenLabs द्वारा संचालित कन्वर्सेशनल AI