Eleven Music से मिलें। किसी भी पल के लिए परफेक्ट गाना बनाएं।

ElevenLabs बीटा चरण से बाहर और Eleven Multilingual v2 लॉन्च: 30 भाषाओं के लिए एक AI वॉइस मॉडल

22 अग॰ 2023 • 6 मिनट पढ़ने का समय

AI वॉइस प्लेटफॉर्म ElevenLabsभाषाई बाधाओं को दूर करने के प्रयास में एक महत्वपूर्ण कदम उठा रहा है, एक नए डीप लर्निंग बेस मॉडल के लॉन्च के साथ जो 30 भाषाओं में मल्टीलिंगुअल क्षमताओं का समर्थन करता है: Eleven Multilingual v2
यह प्रगति मीडिया कंपनियों, गेम डेवलपर्स, प्रकाशकों और स्वतंत्र क्रिएटर्स को उनके कंटेंट की पहुंच को काफी हद तक बढ़ाने में मदद करेगी
ये नई विशेषताएं, जो जनवरी में प्लेटफॉर्म के लॉन्च के बाद से कई नई चीजों और सुधारों के बाद आई हैं, कंपनी के बीटा चरण के आधिकारिक अंत को भी चिह्नित करती हैं
ElevenLabs का मिशन है कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाया जाए

लंदन, यूनाइटेड किंगडम - ElevenLabs, AI वॉइस सॉफ़्टवेयर में वैश्विक नेता, ने आज एक नया मल्टीलिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया जो 30 भाषाओं में 'भावनाओं से भरपूर' AI ध्वनियों को सटीकता से उत्पन्न करने में सक्षम है।

यह प्रगति, पूरी तरह से आंतरिक अनुसंधान पर आधारित है, क्रिएटर्स को यूरोप, एशिया और मध्य पूर्व के अंतरराष्ट्रीय बाजारों के लिए स्थानीयकृत ऑडियो कंटेंट बनाने की अनुमति देगी। ElevenLabs ने पिछले 18 महीनों में मानव भाषण की विशेषताओं का विश्लेषण करने, संदर्भ को समझने और भाषण जनरेशन में भावनाओं को व्यक्त करने के लिए नए तंत्र बनाने, और नई और अनूठी आवाज़ों को सिंथेसाइज़ करने में बिताया है।

Eleven Multilingual v2 के साथ, जब ElevenLabs के वॉइस सिंथेसिस प्लेटफॉर्म में एक टेक्स्ट डाला जाता है, तो नया मॉडल लगभग 30 लिखित भाषाओं की पहचान कर सकता है और उनमें अभूतपूर्व प्रामाणिकता के स्तर के साथ भाषण उत्पन्न कर सकता है।

इसके अलावा, चाहे वह सिंथेटिक आवाज़ हो या क्लोन की गई आवाज़, वक्ता की अनूठी विशेषताएं सभी भाषाओं में संरक्षित रहती हैं, जिसमें उसका मूल उच्चारण भी शामिल है। इस प्रकार, वही आवाज़ 30 विभिन्न भाषाओं में कंटेंट को जीवंत बनाने के लिए उपयोग की जा सकती है।

यह लॉन्च के बाद आता है प्लेटफॉर्म के सभी क्रिएटर्स के लिए पेशेवर वॉइस क्लोनिंग के लॉन्च के बाद। इस प्रोडक्ट अपडेट, जो अतिरिक्त सुरक्षा सुविधाओं के साथ लॉन्च किया गया था, यूज़र्स को अपनी खुद की आवाज़ की एक डिजिटल कॉपी बनाने की अनुमति देता है; जो लगभग

मूल से अलग करना असंभव है। इस नए संस्करण के साथ, आपकी आवाज़ लगभग 30 भाषाओं में मॉडल के मल्टीलिंगुअल संस्करण में व्यक्त हो सकेगी।

समर्थित भाषाओं में शामिल हैं: कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, अरबी और तमिल। ये पहले से उपलब्ध भाषाओं में शामिल हो रही हैं, जिनमें अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इतालवी, हिंदी और पुर्तगाली शामिल हैं।

हाल के फीचर लॉन्च और प्लेटफॉर्म के निरंतर सुधार के बाद, ElevenLabs ने आज यह भी पुष्टि की कि प्लेटफॉर्म आधिकारिक तौर पर अपने बीटा चरण से बाहर आ रहा है। यह परिवर्तन कंपनी की प्रतिबद्धता में एक महत्वपूर्ण मोड़ को चिह्नित करता है कि वह दुनिया भर में अपने एक मिलियन से अधिक यूज़र्स को विश्वसनीय और अत्याधुनिक उपकरण प्रदान करे।

भविष्य में, ElevenLabs उपयोगकर्ताओं को अपनी आवाज़ें प्लेटफॉर्म पर साझा करने और नए ध्वनियों के विकास से लाभ उठाने की अनुमति देने के लिए एक तंत्र पेश करने की योजना बना रहा है, जिससे मानव और AI के बीच सहयोग की संभावनाएं बढ़ेंगी।

माटी स्टानिस्ज़ेव्स्की, ElevenLabs के सीईओ और सह-संस्थापक, टिप्पणी करते हैं:

« ElevenLabs की स्थापना इस उद्देश्य से की गई थी कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाया जाए। Eleven Multilingual v2 की रिलीज़ के साथ, हम अपने लक्ष्य के और करीब आ रहे हैं, जो इस सपने को वास्तविकता बनाने और सभी बोलियों में मानव गुणवत्ता की AI आवाज़ें उपलब्ध कराने का है।

« हमारे वॉइस सिंथेसिस टूल्स सभी को समान स्तर पर लाते हैं और सभी क्रिएटर्स को उच्च गुणवत्ता वाली ऑडियो वॉइस क्षमताएं प्रदान करते हैं। ये लाभ अब लगभग 30 भाषाओं में मल्टीलिंगुअल एप्लिकेशनों तक विस्तारित हो गए हैं। अंततः, हम AI की मदद से और भी अधिक भाषाओं और आवाज़ों को कवर करने की उम्मीद करते हैं, और कंटेंट पर भाषाई बाधाओं को समाप्त करना चाहते हैं। ElevenLabs में, हमें विश्वास है कि ये प्रगति अंततः रचनात्मकता, नवाचार और विविधता को बढ़ावा देगी। »

कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, ElevenLabs कंपनियों और क्रिएटर्स को अधिक कल्पनाशील और सुलभ कंटेंट बनाने की अनुमति देता है जो सभी संस्कृतियों और भाषाओं को ध्यान में रखता है।

के लिए स्वतंत्र गेम डेवलपर्स और प्रकाशक, मल्टीलिंगुअल वॉइस जनरेशन टूल गेम अनुभवों और ऑडियो कंटेंट को अंतरराष्ट्रीय दर्शकों के लिए अनुवाद करने की अनुमति देता है, खिलाड़ियों और श्रोताओं के साथ उनकी अपनी भाषा में जुड़ने के लिए, बिना बोले गए ऑडियो की गुणवत्ता या सटीकता से समझौता किए।

इसी तरह, शैक्षणिक संस्थान अब शिक्षार्थियों को लक्षित भाषाओं में सटीक ऑडियो कंटेंट तुरंत प्रदान करने में सक्षम हैं, जिससे भाषा समझ और उच्चारण कौशल को मजबूत किया जा सके और अंतरराष्ट्रीय छात्रों की विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा किया जा सके।

सभी प्रकार के क्रिएटर्स ElevenLabs के टूल का उपयोग कर सकते हैं दृष्टिहीन लोगों या अतिरिक्त सीखने की आवश्यकताओं वाले लोगों के लिए कंटेंट की पहुंच को बढ़ाने के लिए, दृश्य कंटेंट को कई भाषाओं में उपलब्ध भाषण के साथ पूरक करके।

जनवरी 2023 में अनावरण किए गए अपने पहले AI वॉइस टूल्स सेट में किसी भी टेक्स्ट को पूर्व-निर्मित सिंथेटिक आवाज़ों के चयन के माध्यम से भाषण में बदलने की क्षमता और आपकी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। मल्टीलिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के मिशन में एक नया कदम है, जो सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाने के लिए है।

इस तकनीक को पहले ही कई क्षेत्रों और रचनात्मक वर्टिकल्स में अपनाया जा चुका है, जिसमें स्वतंत्र लेखकों को ऑडियोबुक बनाने में सक्षम बनाना, वीडियो गेम में सहायक पात्रों को आवाज़ देना, दृष्टिहीन लोगों को ऑनलाइन लिखित कंटेंट तक पहुंचने में मदद करना और दुनिया के पहले AI रेडियो चैनल को शक्ति देना शामिल है। ElevenLabs ने प्रमुख क्रिएटर्स और कंटेंट स्टूडियो की एक श्रृंखला के साथ भी साझेदारी की है, जिसमें AI वीडियो जनरेटर्स D-ID, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक , Storytel, खुले एक्सेस वैज्ञानिक वीडियो प्लेटफॉर्म ScienceCast जिसका वीडियो जनरेशन टूल arXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को एकत्र करता है, दुनिया की प्रमुख कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishing, अद्भुत गेम डेवलपर्स जैसे Embark Studios और Paradox Interactive, और मल्टीमीडिया प्लेटफॉर्म MNTN.

ElevenLabs टीम के लेखों को देखें

Safety

Safety

Safety framework for AI voice agents

AI voice agents are increasingly being used in customer service, entertainment, and enterprise applications. With this shift comes the need for clear safeguards to ensure responsible use.

Product

Product

How we engineered RAG to be 50% faster

Tips from latency-sensitive RAG systems in production

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें