ElevenLabs बीटा से बाहर आ गया है और Eleven Multilingual v2 जारी किया है - लगभग 30 भाषाओं के लिए एक आधारभूत AI स्पीच मॉडल

इस प्रगति से दुनिया भर की मीडिया कंपनियों, गेम डेवलपर्स, प्रकाशकों और स्वतंत्र रचनाकारों को अपनी विषय-वस्तु की पहुंच में नाटकीय रूप से सुधार करने में मदद मिलेगी।

  • वॉयस एआई प्लेटफॉर्म ElevenLabs बहुभाषी क्षमताओं का समर्थन करने वाले एक नए आधारभूत गहन शिक्षण मॉडल के विमोचन के साथ विषय-वस्तु की भाषाई बाधाओं को समाप्त करने के अपने प्रयासों में एक क्रांतिकारी छलांग लगाई है। ऑडियो कॉन्टेंट बनाने की सुविधा देती ग्यारह बहुभाषी v2
  • इस प्रगति से दुनिया भर की मीडिया कंपनियों, गेम डेवलपर्स, प्रकाशकों और स्वतंत्र रचनाकारों को अपनी सामग्री की पहुंच में नाटकीय रूप से सुधार करने में मदद मिलेगी
  • ये नई क्षमताएं, जो जनवरी में प्लेटफॉर्म लॉन्च होने के बाद से कई नई सुविधाओं के रिलीज और सुधारों के बाद आई हैं, कंपनी के बीटा चरण के आधिकारिक अंत का भी संकेत देती हैं
  • इलेवनलैब्स का मिशन सभी सामग्री को किसी भी भाषा और किसी भी आवाज़ में सार्वभौमिक रूप से सुलभ बनाना है

ElevenLabsवॉयस एआई सॉफ्टवेयर में विश्व-अग्रणी, ने आज एक नया बहुभाषी वॉयस जेनरेशन मॉडल लॉन्च किया है लगभग 30 भाषाओं में 'भावनात्मक रूप से समृद्ध' एआई ऑडियो का सटीक रूप से उत्पादन करने में सक्षम।

यह प्रगति, जो पूर्णतः आंतरिक अनुसंधान पर आधारित है, रचनाकारों को यूरोप, एशिया और मध्य पूर्व के अंतर्राष्ट्रीय बाजारों के लिए स्थानीयकृत ऑडियो सामग्री तैयार करने में सक्षम बनाएगी। इलेवनलैब्स ने पिछले 18 महीने मानव वाणी के संकेतों का विश्लेषण करने, वाणी निर्माण में संदर्भ को समझने और भावनाओं को व्यक्त करने के लिए नए तंत्रों का निर्माण करने, साथ ही नई, अनूठी आवाजों को संश्लेषित करने में बिताए हैं।

Eleven Multilingual v2 के साथ, जब ElevenLabs में टेक्स्ट इनपुट किया जाता है टेक्स्ट टू स्पीच प्लैटफ़ॉर्म, नया मॉडल स्वचालित रूप से लगभग 30 लिखित भाषाओं की पहचान कर सकता है और उनमें अभूतपूर्व स्तर की प्रामाणिकता के साथ भाषण उत्पन्न कर सकता है।

साथ ही, चाहे कृत्रिम आवाज या क्लोन आवाज का उपयोग किया जा रहा हो, वक्ता की अद्वितीय आवाज विशेषताओं को सभी भाषाओं में बनाए रखा जाता है, जिसमें उनका मूल उच्चारण भी शामिल है। इसका मतलब यह है कि एक ही आवाज का उपयोग 28 अलग-अलग भाषाओं में सामग्री को जीवंत बनाने के लिए किया जा सकता है।

यह रोल-आउट इस प्रकार है की सार्वजनिक रिलीज चार सप्ताह की प्रतीक्षा अवधि की ज़रूरत होती है, मंच पर सभी रचनाकारों के लिए। यह उत्पाद अद्यतन, जो अतिरिक्त सुरक्षा सुविधाओं के साथ उपलब्ध कराया गया है, उपयोगकर्ताओं को अपनी आवाज की एक आदर्श डिजिटल प्रतिलिपि बनाने की अनुमति देता है; जो मूल से लगभग अप्रभेद्य होगी। आज की रिलीज का मतलब है कि आपकी आवाज बहुभाषी मॉडल द्वारा पेश की गई लगभग 30 भाषाओं में बोलने में सक्षम होगी।

अब समर्थित भाषाओं में शामिल हैं; चीनी, कोरियाई, डच, तुर्की, स्वीडिश, इन्डोनेशियाई, filipino, जापानी, यूक्रेनी, यूनानी, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलायी, स्लोवाक, क्रोएशियाई, क्लासिक अरबी , और तामिल

वे पहले से उपलब्ध भाषाओं में शामिल हो गए शामिल अंग्रेज़ी, पोलिश, जर्मन, स्पैनिश, फ्रेंच, इतालवी, हिन्दी , और पुर्तगाली

हाल ही में फीचर लॉन्च और प्लेटफॉर्म पर चल रहे सुधारों के बाद, इलेवनलैब्स ने आज यह भी पुष्टि की है कि प्लेटफॉर्म आधिकारिक तौर पर बीटा से बाहर आ रहा है। यह परिवर्तन कंपनी के अपने 1 मिलियन से अधिक वैश्विक उपयोगकर्ताओं के लिए विश्वसनीय और अत्याधुनिक उपकरण प्रदान करने के समर्पण में एक महत्वपूर्ण क्षण है।

भविष्य को देखते हुए, इलेवनलैब्स एक ऐसी प्रणाली शुरू करने की योजना बना रही है जो उपयोगकर्ताओं को प्लेटफॉर्म पर आवाज साझा करने और नए ऑडियो के विकास से लाभान्वित करने की अनुमति दे, जिससे मानव-एआई सहयोग के अवसरों को बढ़ावा मिले।

इलेवनलैब्स के सीईओ और सह-संस्थापक मती स्टेनिसजेव्स्की ने कहा:

इलेवनलैब्स की शुरुआत इस सपने के साथ की गई थी कि सभी सामग्री को किसी भी भाषा और किसी भी आवाज में सार्वभौमिक रूप से सुलभ बनाया जाए। इलेवन मल्टीलिंगुअल v2 के रिलीज के साथ, हम इस सपने को वास्तविकता बनाने और हर बोली में मानव-गुणवत्ता वाली AI आवाजें उपलब्ध कराने के एक कदम और करीब आ गए हैं।

"हमारे टेक्स्ट-टू-स्पीच जेनरेशन टूल सभी रचनाकारों को समान अवसर प्रदान करने तथा उच्च गुणवत्ता वाली मौखिक ऑडियो क्षमताएं उपलब्ध कराने में मदद करते हैं। ये लाभ अब लगभग 30 भाषाओं में बहुभाषी अनुप्रयोगों तक विस्तारित हो गए हैं। अंततः हम आशा करते हैं कि हम एआई की सहायता से और भी अधिक भाषाओं और आवाजों को कवर कर सकेंगे, तथा विषय-वस्तु में भाषाई बाधाओं को समाप्त कर सकेंगे। इलेवनलैब्स में, हमारा मानना ​​है कि सुलभता में ये उछाल अंततः अधिक रचनात्मकता, नवाचार और विविधता को बढ़ावा देगा।

विभिन्न भाषाओं में उच्च गुणवत्ता वाली ऑडियो सामग्री बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, इलेवनलैब्स कम्पनियों और रचनाकारों को अधिक कल्पनाशील और सुलभ सामग्री बनाने में सक्षम बना रहा है, जो विभिन्न संस्कृतियों और भाषाओं में प्रतिध्वनित होती है।

प्रोफ़ेशनल वॉइस क्लोनिंग के लिए लगभग स्वतंत्र खेल डेवलपर्स और प्रकाशकबहुभाषी भाषण सृजन उपकरण, अंतर्राष्ट्रीय दर्शकों के लिए खेल के अनुभवों और ऑडियो सामग्री का अनुवाद करने के नए अवसर प्रदान करता है, तथा बोले गए ऑडियो की गुणवत्ता या सटीकता से समझौता किए बिना खिलाड़ियों और श्रोताओं से उनकी अपनी भाषा में जुड़ता है।

इसी प्रकार, शिक्षण संस्थानों अब हमारे पास शिक्षार्थियों को लक्षित भाषाओं में सटीक ऑडियो सामग्री तुरन्त उपलब्ध कराने, भाषा समझ और उच्चारण कौशल को बढ़ाने, साथ ही अंतर्राष्ट्रीय छात्रों के लिए विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा करने का साधन है।

सभी प्रकार के क्रिएटर अपनी सामग्री को बेहतर बनाने के लिए ElevenLabs के टूल का उपयोग कर सकते हैं एक्सेसिबिलिटी दृश्य-बाधित या अतिरिक्त शिक्षण आवश्यकताओं वाले लोगों के लिए दृश्य सामग्री के साथ-साथ अनेक भाषाओं में उपलब्ध भाषण भी उपलब्ध कराया जाएगा।

जनवरी 2023 में अनावरण किए गए इसके एआई वॉयस टूल्स के प्रारंभिक सूट में पूर्व-डिज़ाइन किए गए, सिंथेटिक आवाज़ों के चयन के माध्यम से किसी भी पाठ को भाषण में बदलने की क्षमता और अपनी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। बहुभाषी वाक् संश्लेषण उपकरण, सभी विषय-वस्तु को किसी भी भाषा और किसी भी आवाज में सार्वभौमिक रूप से सुलभ बनाने के इलेवनलैब्स के मिशन की दिशा में एक और कदम है।

इस प्रौद्योगिकी को पहले ही अनेक रचनात्मक क्षेत्रों और कार्यक्षेत्रों में अपनाया जा चुका है, जिसमें स्वतंत्र लेखकों को ऑडियो पुस्तकें बनाने में सक्षम बनाना, वीडियो गेम में द्वितीयक पात्रों को आवाज देना, दृष्टिबाधित लोगों को ऑनलाइन लिखित सामग्री तक पहुंच प्रदान करना, तथा विश्व के प्रथम एआई रेडियो चैनल को सशक्त बनाना शामिल है। इलेवनलैब्स ने कई प्रमुख कंटेंट क्रिएटर्स और स्टूडियो के साथ साझेदारी की है, जिसमें एआई वीडियो जनरेटर भी शामिल हैं किया, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक स्टोरीटेल, ओपन-एक्सेस विज्ञान वीडियो प्लेटफ़ॉर्म साइंसकास्ट जिसका वीडियो निर्माण उपकरण प्रकाशित वैज्ञानिक शोध पत्रों को संक्षिप्त करता है एआरएक्सिव, अग्रणी वैश्विक सामग्री निर्माता मंच द सोल पब्लिशिंग, अविश्वसनीय खेल डेवलपर्स की तरह एम्बार्क स्टूडियोज़ , और पैराडॉक्स इंटरएक्टिव, और मीडिया प्लेटफॉर्म एमएनटीएन.

संपर्क
press@elevenlabs.io

और खोजें

Company

What happens when two AI voice assistants have a conversation?

At the ElevenLabs London Hackathon, developers created GibberLink, a groundbreaking protocol that lets AI agents recognize each other and switch to a hyper-efficient sound-based language—making AI-to-AI communication 80% faster and more reliable.

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

फ़्री शुरू करें

पहले से अकाउंट है? लॉग इन करें