ElevenLabs बीटा चरण से बाहर और Eleven Multilingual v2 लॉन्च: 30 भाषाओं के लिए एक AI वॉइस मॉडल

22 अग॰ 2023 • 5 मिनट पढ़ने का समय

AI वॉइस प्लेटफॉर्म ElevenLabsभाषाई बाधाओं को दूर करने के प्रयास में एक महत्वपूर्ण कदम उठा रहा है, एक नए डीप लर्निंग बेस मॉडल के लॉन्च के साथ जो 30 भाषाओं में मल्टीलिंगुअल क्षमताओं का समर्थन करता है: इलेवन मल्टीलिंगुअल v2
यह प्रगति मीडिया कंपनियों, गेम डेवलपर्स, प्रकाशकों और स्वतंत्र क्रिएटर्स को उनके कंटेंट की पहुंच को काफी हद तक बढ़ाने में मदद करेगी
ये नई विशेषताएं, जो जनवरी में प्लेटफॉर्म के लॉन्च के बाद से कई नई चीजों और सुधारों के बाद आई हैं, कंपनी के बीटा चरण के आधिकारिक अंत को भी चिह्नित करती हैं
ElevenLabs का मिशन है कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाया जाए

लंदन, यूनाइटेड किंगडम - ElevenLabs, AI वॉइस सॉफ़्टवेयर में वैश्विक नेता, ने आज एक नया मल्टीलिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया जो 30 भाषाओं में 'भावनाओं से भरपूर' AI ध्वनियों को सटीकता से उत्पन्न करने में सक्षम है।

यह प्रगति, पूरी तरह से आंतरिक अनुसंधान पर आधारित है, क्रिएटर्स को यूरोप, एशिया और मध्य पूर्व के अंतरराष्ट्रीय बाजारों के लिए स्थानीयकृत ऑडियो कंटेंट बनाने की अनुमति देगी। ElevenLabs ने पिछले 18 महीनों में मानव भाषण की विशेषताओं का विश्लेषण करने, संदर्भ को समझने और भाषण जनरेशन में भावनाओं को व्यक्त करने के लिए नए तंत्र बनाने, और नई और अनूठी आवाज़ों को सिंथेसाइज़ करने में बिताया है।

Eleven Multilingual v2 के साथ, जब ElevenLabs के वॉइस सिंथेसिस प्लेटफॉर्म में एक टेक्स्ट डाला जाता है, तो नया मॉडल लगभग 30 लिखित भाषाओं की पहचान कर सकता है और उनमें अभूतपूर्व प्रामाणिकता के स्तर के साथ भाषण उत्पन्न कर सकता है।

इसके अलावा, चाहे वह सिंथेटिक आवाज़ हो या क्लोन की गई आवाज़, वक्ता की अनूठी विशेषताएं सभी भाषाओं में संरक्षित रहती हैं, जिसमें उसका मूल उच्चारण भी शामिल है। इस प्रकार, वही आवाज़ 30 विभिन्न भाषाओं में कंटेंट को जीवंत बनाने के लिए उपयोग की जा सकती है।

यह लॉन्च के बाद आता है प्लेटफॉर्म के सभी क्रिएटर्स के लिए पेशेवर वॉइस क्लोनिंग के लॉन्च के बाद। इस प्रोडक्ट अपडेट, जो अतिरिक्त सुरक्षा सुविधाओं के साथ लॉन्च किया गया था, यूज़र्स को अपनी खुद की आवाज़ की एक डिजिटल कॉपी बनाने की अनुमति देता है; जो लगभग

मूल से अलग करना असंभव है। इस नए संस्करण के साथ, आपकी आवाज़ लगभग 30 भाषाओं में मॉडल के मल्टीलिंगुअल संस्करण में व्यक्त हो सकेगी।

समर्थित भाषाओं में शामिल हैं: कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, अरबी और तमिल। ये पहले से उपलब्ध भाषाओं में शामिल हो रही हैं, जिनमें अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इतालवी, हिंदी और पुर्तगाली शामिल हैं।

हाल के फीचर लॉन्च और प्लेटफॉर्म के निरंतर सुधार के बाद, ElevenLabs ने आज यह भी पुष्टि की कि प्लेटफॉर्म आधिकारिक तौर पर अपने बीटा चरण से बाहर आ रहा है। यह परिवर्तन कंपनी की प्रतिबद्धता में एक महत्वपूर्ण मोड़ को चिह्नित करता है कि वह दुनिया भर में अपने एक मिलियन से अधिक यूज़र्स को विश्वसनीय और अत्याधुनिक उपकरण प्रदान करे।

भविष्य में, ElevenLabs उपयोगकर्ताओं को अपनी आवाज़ें प्लेटफॉर्म पर साझा करने और नए ध्वनियों के विकास से लाभ उठाने की अनुमति देने के लिए एक तंत्र पेश करने की योजना बना रहा है, जिससे मानव और AI के बीच सहयोग की संभावनाएं बढ़ेंगी।

माटी स्टानिस्ज़ेव्स्की, ElevenLabs के सीईओ और सह-संस्थापक, टिप्पणी करते हैं:

« ElevenLabs की स्थापना इस उद्देश्य से की गई थी कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाया जाए। Eleven Multilingual v2 की रिलीज़ के साथ, हम अपने लक्ष्य के और करीब आ रहे हैं, जो इस सपने को वास्तविकता बनाने और सभी बोलियों में मानव गुणवत्ता की AI आवाज़ें उपलब्ध कराने का है।

« हमारे वॉइस सिंथेसिस टूल्स सभी को समान स्तर पर लाते हैं और सभी क्रिएटर्स को उच्च गुणवत्ता वाली ऑडियो वॉइस क्षमताएं प्रदान करते हैं। ये लाभ अब लगभग 30 भाषाओं में मल्टीलिंगुअल एप्लिकेशनों तक विस्तारित हो गए हैं। अंततः, हम AI की मदद से और भी अधिक भाषाओं और आवाज़ों को कवर करने की उम्मीद करते हैं, और कंटेंट पर भाषाई बाधाओं को समाप्त करना चाहते हैं। ElevenLabs में, हमें विश्वास है कि ये प्रगति अंततः रचनात्मकता, नवाचार और विविधता को बढ़ावा देगी। »

कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, ElevenLabs कंपनियों और क्रिएटर्स को अधिक कल्पनाशील और सुलभ कंटेंट बनाने की अनुमति देता है जो सभी संस्कृतियों और भाषाओं को ध्यान में रखता है।

के लिए स्वतंत्र गेम डेवलपर्स और प्रकाशक, मल्टीलिंगुअल वॉइस जनरेशन टूल गेम अनुभवों और ऑडियो कंटेंट को अंतरराष्ट्रीय दर्शकों के लिए अनुवाद करने की अनुमति देता है, खिलाड़ियों और श्रोताओं के साथ उनकी अपनी भाषा में जुड़ने के लिए, बिना बोले गए ऑडियो की गुणवत्ता या सटीकता से समझौता किए।

इसी तरह, शैक्षणिक संस्थान अब शिक्षार्थियों को लक्षित भाषाओं में सटीक ऑडियो कंटेंट तुरंत प्रदान करने में सक्षम हैं, जिससे भाषा समझ और उच्चारण कौशल को मजबूत किया जा सके और अंतरराष्ट्रीय छात्रों की विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा किया जा सके।

सभी प्रकार के क्रिएटर्स ElevenLabs के टूल का उपयोग कर सकते हैं दृष्टिहीन लोगों या अतिरिक्त सीखने की आवश्यकताओं वाले लोगों के लिए कंटेंट की पहुंच को बढ़ाने के लिए, दृश्य कंटेंट को कई भाषाओं में उपलब्ध भाषण के साथ पूरक करके।

जनवरी 2023 में अनावरण किए गए अपने पहले AI वॉइस टूल्स सेट में किसी भी टेक्स्ट को पूर्व-निर्मित सिंथेटिक आवाज़ों के चयन के माध्यम से भाषण में बदलने की क्षमता और आपकी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। मल्टीलिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के मिशन में एक नया कदम है, जो सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाने के लिए है।

इस तकनीक को पहले ही कई क्षेत्रों और रचनात्मक वर्टिकल्स में अपनाया जा चुका है, जिसमें स्वतंत्र लेखकों को ऑडियोबुक बनाने में सक्षम बनाना, वीडियो गेम में सहायक पात्रों को आवाज़ देना, दृष्टिहीन लोगों को ऑनलाइन लिखित कंटेंट तक पहुंचने में मदद करना और दुनिया के पहले AI रेडियो चैनल को शक्ति देना शामिल है। ElevenLabs ने प्रमुख क्रिएटर्स और कंटेंट स्टूडियो की एक श्रृंखला के साथ भी साझेदारी की है, जिसमें AI वीडियो जनरेटर्स D-ID, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक , स्टोरीटेल, खुले एक्सेस वैज्ञानिक वीडियो प्लेटफॉर्म साइंसकास्ट जिसका वीडियो जनरेशन टूल arXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को एकत्र करता है, दुनिया की प्रमुख कंटेंट क्रिएशन प्लेटफॉर्म दसोल पब्लिशिंग, अद्भुत गेम डेवलपर्स जैसे एम्बार्क स्टूडियोज और पैराडॉक्स इंटरएक्टिव, और मल्टीमीडिया प्लेटफॉर्म एमएनटीएन.

ElevenLabs टीम के लेखों को देखें

Customer stories

Customer stories

Le Walk brings cities to life with ElevenLabs

Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session

Agents Platform Stories

Voxpopme enhances AI Moderator with ElevenLabs Agents Platform

Supporting 10,000+ research conversations with natural, trustworthy voices

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें

ElevenLabs द्वारा संचालित एजेंट्स