
Guardrails 2.0: A redesigned control layer in ElevenAgents
Configurable safety controls for enterprise-ready agent deployments.
लंदन, यूनाइटेड किंगडम– ElevenLabs, दुनिया की अग्रणी AI वॉइस सॉफ्टवेयर कंपनी, ने आज एक नया मल्टी-लिंगुअल वॉइस जनरेशन मॉडल लॉन्च किया है, जो 30 भाषाओं में 'इमोशन से भरपूर' AI ऑडियो बना सकता है।
यह पूरी तरह हमारी खुद की रिसर्च पर आधारित है, जिससे डेवलपर्स अब यूरोप, एशिया और मिडिल ईस्ट के इंटरनेशनल मार्केट्स के लिए लोकलाइज़्ड ऑडियो कंटेंट बना सकते हैं। पिछले 18 महीनों में ElevenLabs ने इंसानी भाषा के पैटर्न्स को समझा, स्पीच जनरेशन में कॉन्टेक्स्ट और इमोशन को बेहतर तरीके से लाने के नए तरीके बनाए और कई नई, अनोखी आवाज़ें सिंथेसाइज़ कीं।
Eleven Multilingual v2 के साथ हमारा नया मॉडल ElevenLabs की टेक्स्ट टू स्पीच प्लेटफॉर्म पर लगभग 30 लिखी जाने वाली भाषाओं को अपने आप पहचान सकता है और इन भाषाओं में पहले से कहीं ज्यादा असली जैसी आवाज़ में स्पीच बना सकता है।
चाहे आप सिंथेटिक या क्लोन की गई आवाज़ इस्तेमाल करें, हर भाषा में स्पीकर की यूनिक वॉइस क्वालिटी और ओरिजिनल एक्सेंट बरकरार रहता है। यानी एक ही आवाज़ में 30 अलग-अलग भाषाओं में कंटेंट सुनाया जा सकता है।
यह लॉन्च प्लेटफॉर्म पर सभी क्रिएटर्स के लिए Professional Voice Cloning के पब्लिक रिलीज के बाद आया है। इस प्रोडक्ट अपडेट के साथ, जो अतिरिक्त सुरक्षा फीचर्स के साथ आया है, यूज़र अपनी खुद की आवाज़ की एकदम सटीक डिजिटल कॉपी बना सकते हैं, जो
असली से लगभग अलग नहीं की जा सकती। आज के लॉन्च के साथ, आपकी आवाज़ अब लगभग 30 भाषाओं में बोल सकती है, जो इस मल्टी-लिंगुअल मॉडल में उपलब्ध हैं।
सपोर्टेड भाषाओं में शामिल हैं: कोरियन, डच, तुर्की, स्वीडिश, इंडोनेशियन, वियतनामी, फिलिपीनो, यूक्रेनियन, ग्रीक, चेक, फिनिश, रोमानियन, डेनिश, बुल्गेरियन, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियन, अरबी (स्टैंडर्ड) और तमिल। ये भाषाएं पहले से उपलब्ध अंग्रेज़ी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटैलियन, हिंदी और पुर्तगाली के साथ जुड़ती हैं।
नई सुविधाओं के लॉन्च और प्लेटफॉर्म में लगातार सुधार के बाद ElevenLabs ने आज पुष्टि की है कि प्लेटफॉर्म ने आधिकारिक तौर पर बीटा फेज़ छोड़ दिया है। यह बदलाव हमारे 1 मिलियन से ज्यादा यूज़र्स को भरोसेमंद और एडवांस टूल्स देने के हमारे वादे का अहम पड़ाव है।
आगे चलकर ElevenLabs एक ऐसा फीचर लाने की योजना बना रहा है, जिससे यूज़र अपनी आवाज़ें प्लेटफॉर्म पर शेयर कर सकें और नई ऑडियो डाटा के विकास से फायदा उठा सकें, ताकि इंसान और AI के बीच सहयोग और बढ़े।
Mati Staniszewski, ElevenLabs के सीईओ और फाउंडर ने कहा:
“ElevenLabs की शुरुआत इस सपने के साथ हुई थी कि हर कंटेंट हर भाषा और हर आवाज़ में सबके लिए उपलब्ध हो। Eleven Multilingual v2 के लॉन्च के साथ हम इस सपने के और करीब आ गए हैं और अब हर डायलैक्ट में इंसान जैसी क्वालिटी की AI वॉइस उपलब्ध करा रहे हैं।
हमारे वॉइस सिंथेसिस टूल्स हर क्रिएटर के लिए रास्ता खोलते हैं और उन्हें हाई-क्वालिटी वॉइस सिंथेसिस के विकल्प देते हैं। अब ये फायदे लगभग 30 भाषाओं में मल्टी-लिंगुअल एप्लिकेशन तक पहुंच गए हैं। आगे हम AI की मदद से और भी ज्यादा भाषाओं और आवाज़ों को जोड़ना चाहते हैं, ताकि कंटेंट के लिए भाषा की दीवारें खत्म हों। ElevenLabs में हम मानते हैं कि ऐसी पहुंच बढ़ने से आखिरकार ज्यादा क्रिएटिविटी, इनोवेशन और विविधता आएगी।”
ElevenLabs उन लागतों और संसाधनों को कम करता है, जो कई भाषाओं में हाई-क्वालिटी ऑडियो कंटेंट बनाने में लगते हैं। कंपनियां और क्रिएटर्स अब और ज्यादा इनोवेटिव और आसानी से पहुंचने वाला कंटेंट बना सकते हैं, जो अलग-अलग संस्कृतियों और भाषाओं के लोगों को जोड़ता है।
स्वतंत्र गेम डेवलपर्स और पब्लिशर्स के लिए यह मल्टी-लिंगुअल वॉइस जनरेशन टूल नए मौके खोलता है, जिससे वे इंटरनेशनल ऑडियंस के लिए गेम एक्सपीरियंस और ऑडियो कंटेंट ट्रांसलेट कर सकते हैं और खिलाड़ियों व श्रोताओं से उनकी अपनी भाषा में जुड़ सकते हैं, वो भी वॉइस क्वालिटी या सटीकता से समझौता किए बिना।
इसी तरह शैक्षिक संस्थानों के पास अब यह विकल्प है कि वे छात्रों को तुरंत उनकी टारगेट भाषा में सटीक ऑडियो कंटेंट दें, जिससे भाषा समझने और उच्चारण में सुधार हो और इंटरनेशनल छात्रों की अलग-अलग पढ़ाई की जरूरतों को पूरा किया जा सके।
हर तरह के क्रिएटर्स ElevenLabs के टूल का इस्तेमाल कर सकते हैं, ताकि उनकी कंटेंट की पहुंच दृष्टिबाधित या अतिरिक्त सीखने की जरूरत वाले लोगों तक बढ़ाई जा सके, और विज़ुअल कंटेंट को कई भाषाओं में वॉइस के साथ और समृद्ध बनाया जा सके।
जनवरी 2023 में पेश की गई हमारी पहली AI वॉइस टूल्स की सीरीज़ किसी भी टेक्स्ट को वॉइस में बदलने की सुविधा देती है, जिसमें कई प्री-डिफाइंड सिंथेटिक वॉइस चुनने और अपनी खुद की आवाज़ का क्लोन बनाने का विकल्प है। मल्टी-लिंगुअल वॉइस सिंथेसिस टूल ElevenLabs के उस मिशन की अगली कड़ी है, जिसमें हर कंटेंट को हर भाषा और हर आवाज़ में सबके लिए उपलब्ध बनाना है।
यह टेक्नोलॉजी पहले से ही कई क्रिएटिव इंडस्ट्रीज़ और सेक्टर्स में इस्तेमाल हो रही है। इससे स्वतंत्र लेखक ऑडियोबुक बना सकते हैं, वीडियो गेम्स के साइड कैरेक्टर्स को आवाज़ दे सकते हैं, दृष्टिबाधित लोगों को ऑनलाइन लिखित कंटेंट सुनने में मदद मिलती है और दुनिया का पहला AI रेडियो स्टेशन चलाया जा सकता है। ElevenLabs ने कई अग्रणी कंटेंट क्रिएटर्स और स्टूडियोज़ के साथ साझेदारी भी की है, जिनमें AI वीडियो जनरेटर D-ID, Storytel, दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक, ओपन-एक्सेस वीडियो प्लेटफॉर्म ScienceCast, जिसका वीडियो जनरेशन टूल साइंटिफिक रिसर्च पेपर्स को एकत्र करता है, जो arXiv पर प्रकाशित हुए हैं, दुनिया का अग्रणी कंटेंट क्रिएशन प्लेटफॉर्म TheSoul Publishingशानदार गेम डेवलपर्स जैसे Embark Studiosऔर Paradox Interactiveऔर मीडिया प्लेटफॉर्म MNTN.

Configurable safety controls for enterprise-ready agent deployments.
.webp&w=3840&q=95)
How to build a complete marketing campaign from scratch, including video, voiceover, music, and sound effects.