
Eleven v3 Audio Tags: Emulating accents with precision
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Eleven v3 अल्फा का परिचय
v3 आजमाएंलंदन, यूनाइटेड किंगडम - लॉन्च कियाElevenLabsने, जो AI ऑडियो सॉफ़्टवेयर में विश्व नेता है, आज एक नया बहुभाषी वॉइस जनरेशन मॉडल लॉन्च किया जो 30 भाषाओं में "भावनात्मक समृद्धि" के साथ AI वॉइस उत्पन्न करने में सक्षम है।
यह प्रगति, जो पूरी तरह से आंतरिक अनुसंधान पर आधारित है, क्रिएटर्स को यूरोप, एशिया और मध्य पूर्व के अंतरराष्ट्रीय बाजारों के लिए ऑडियो नेटिव कंटेंट बनाने की अनुमति देगी। ElevenLabs ने पिछले अठारह महीनों में मानव भाषण संकेतों का विश्लेषण किया है, भाषण उत्पन्न करने में संदर्भ को समझने और भावनाओं को व्यक्त करने के लिए नए तंत्र बनाए हैं, साथ ही नई और अनूठी आवाज़ों को इकट्ठा किया है।
Eleven Multilingual v2 मॉडल, जब ElevenLabs के टेक्स्ट टू स्पीच प्लेटफ़ॉर्म में टेक्स्ट डाला जाता है, लगभग 30 लिखित भाषाओं को स्वचालित रूप से पहचानने और उनमें भाषण उत्पन्न करने की क्षमता प्रदान करता है, वह भी अभूतपूर्व प्रामाणिकता के स्तर पर।
इस बीच, चाहे आवाज़ कृत्रिम हो या क्लोन की गई, वक्ता की अनूठी आवाज़ की विशेषताएं सभी भाषाओं में संरक्षित रहेंगी, जिसमें उनकी मूल लहजा भी शामिल है। इसका मतलब है कि एक ही आवाज़ का उपयोग 30 अलग-अलग भाषाओं में कंटेंट को जीवंत बनाने के लिए किया जा सकता है।
यह प्रकाशनसभी कंटेंट क्रिएटर्स के लिए प्लेटफ़ॉर्म पर प्रोफेशनल वॉइस क्लोनिंग के सार्वजनिक रिलीज़ का अनुसरण करता है। यह प्रोडक्ट अपडेट, जो अतिरिक्त सुरक्षा और सुरक्षा सुविधाओं के साथ जारी किया गया है, उपयोगकर्ताओं को अपनी आवाज़ की एक डिजिटल प्रति बनाने की अनुमति देता है; एक वर्चुअल संस्करण
जो मूल से अलग नहीं किया जा सकता। आज का रिलीज़ आपके आवाज़ को लगभग 30 भाषाओं में बोलने की क्षमता प्रदान करता है जो बहुभाषी मॉडल द्वारा पेश की जाती हैं।
समर्थित भाषाओं में शामिल हैं; कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलेशियाई, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, क्लासिकल अरबी और तमिल। ये पहले से उपलब्ध भाषाओं में शामिल हो गई हैं जिनमें अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटालियन, हिंदी और पुर्तगाली शामिल हैं।
ElevenLabs ने, हाल ही में फीचर्स के लॉन्च और प्लेटफ़ॉर्म के निरंतर सुधार के बाद, आज पुष्टि की कि प्लेटफ़ॉर्म आधिकारिक तौर पर बीटा संस्करण से बाहर आ जाएगा। यह संक्रमण कंपनी की अपने एक मिलियन से अधिक वैश्विक उपयोगकर्ताओं को विश्वसनीय और उन्नत उपकरण प्रदान करने की प्रतिबद्धता में एक महत्वपूर्ण क्षण का प्रतिनिधित्व करता है।
भविष्य को देखते हुए, ElevenLabs उपयोगकर्ताओं को प्लेटफ़ॉर्म पर आवाज़ें साझा करने और नई आवाज़ के विकास का लाभ उठाने की अनुमति देने के लिए एक तंत्र पेश करने की योजना बना रहा है, जिससे मानव और AI के बीच सहयोग के अवसर बढ़ेंगे।
ElevenLabs के सीईओ और सह-संस्थापक माटी स्टानिस्ज़व्स्की ने टिप्पणी की:
"ElevenLabs ने एक सपने के साथ शुरुआत की कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में वैश्विक रूप से उपलब्ध कराया जाए। Eleven Multilingual v2 के रिलीज़ ने हमें इस सपने को वास्तविकता में बदलने के एक कदम और करीब ला दिया है और मानव गुणवत्ता वाली AI आवाज़ों को हर लहजे में उपलब्ध कराया है।
"हमारे टेक्स्ट टू स्पीच टूल्स सभी कंटेंट क्रिएटर्स के लिए उच्च गुणवत्ता वाली बोली जाने वाली क्षमताएं प्रदान करते हैं। ये लाभ अब लगभग 30 भाषाओं में बहुभाषी अनुप्रयोगों तक विस्तारित हो गए हैं। हम अंततः AI की मदद से अधिक भाषाओं और आवाज़ों को कवर करने की उम्मीद करते हैं, और कंटेंट के लिए भाषा बाधाओं को दूर करते हैं। ElevenLabs में, हमें विश्वास है कि ये पहुंच में सुधार अंततः अधिक रचनात्मकता, नवाचार और विविधता को बढ़ावा देंगे।"
कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, ElevenLabs कंपनियों और क्रिएटर्स को अधिक रचनात्मक और सुलभ कंटेंट बनाने की अनुमति देता है जो संस्कृतियों और भाषाओं के बीच गूंजता है।
बहुभाषी स्पीच जनरेशन टूल गेम डेवलपर्स और स्वतंत्र प्रकाशकों के लिए नई संभावनाएं प्रदान करता है, जिससे गेमिंग अनुभवों और ऑडियो कंटेंट का अंतरराष्ट्रीय दर्शकों के लिए अनुवाद किया जा सके, और खिलाड़ियों और श्रोताओं के साथ उनकी अपनी भाषाओं में संवाद किया जा सके, बिना बोले गए शब्द की गुणवत्ता या सटीकता से समझौता किए।
इसी तरह, शैक्षिक संस्थानों के पास अब लक्षित भाषाओं में सटीक ऑडियो कंटेंट प्रदान करने के साधन हैं, जिससे भाषा समझ और उच्चारण कौशल को बढ़ावा मिलता है, साथ ही विभिन्न शिक्षण शैलियों और अंतरराष्ट्रीय छात्रों की सीखने की जरूरतों को पूरा किया जाता है।
सभी प्रकार के क्रिएटर्स ElevenLabs के टूल का उपयोग कर सकते हैं ताकि दृष्टिबाधित या अतिरिक्त सीखने की जरूरतों वाले लोगों के लिए कंटेंट की पहुंच को बेहतर बनाया जा सके, दृश्य सामग्री को कई भाषाओं में उपलब्ध भाषण के साथ पूरक करके।
जनवरी 2023 में अनावरण किए गए AI ऑडियो टूल्स के अपने प्रारंभिक सेट में किसी भी टेक्स्ट को पहले से डिज़ाइन की गई कृत्रिम आवाज़ों की एक श्रृंखला के माध्यम से भाषण में बदलने की क्षमता और अपनी आवाज़ की एक प्रति बनाने की क्षमता शामिल थी। बहुभाषी स्पीच सिंथेसिस टूल ElevenLabs के मिशन में एक और कदम है कि सभी कंटेंट को किसी भी भाषा और किसी भी आवाज़ में वैश्विक रूप से उपलब्ध कराया जाए।
कई क्षेत्रों और रचनात्मक क्षेत्रों ने पहले ही इस तकनीक को अपनाया है, जिसमें स्वतंत्र लेखकों को ऑडियोबुक बनाने में सक्षम बनाना, वीडियो गेम में सहायक पात्रों को आवाज़ देना, दृष्टिबाधित लोगों को ऑनलाइन लिखित सामग्री तक पहुंचने में मदद करना, और दुनिया के पहले AI रेडियो चैनल को संचालित करना शामिल है। ElevenLabs ने कई प्रमुख कंटेंट क्रिएटर्स और स्टूडियो के साथ साझेदारी की है, जिसमें AI वीडियो जनरेटर D-ID, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक Storytel, ओपन एक्सेस साइंटिफिक वीडियो प्लेटफ़ॉर्म ScienceCast जो arXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को संक्षेपित करता है, वैश्विक कंटेंट क्रिएटर प्लेटफ़ॉर्म TheSoul Publishing, और अद्भुत गेम डेवलपर्स जैसे Embark Studios और Paradox Interactive, और MNTN मीडिया प्लेटफ़ॉर्म शामिल हैं।
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.