
ElevenLabs and AILAS launch voice ID system to protect actors from AI misuse
Japanese actors and voice actors can now mark their voices as authorized for AI use
लंदन, यूकेलंदन, यूके - वैश्विक वॉइस AI सॉफ़्टवेयर के नेताElevenLabsने30 भाषाओं में 'भावनात्मक' AI आवाज़ें सटीकता से उत्पन्न करने में सक्षमएक नया मल्टीलिंगुअल वॉइस जनरेशन मॉडल पेश किया।
यह प्रगति पूरी तरह से इन-हाउस रिसर्च पर आधारित है, और अब क्रिएटर्स यूरोप, एशिया, मिडल ईस्ट के अंतरराष्ट्रीय बाजारों के लिए स्थानीयकृत वॉइस कंटेंट बना सकते हैं। ElevenLabs ने 18 महीनों तक मानव भाषण के मार्कर्स का विश्लेषण किया है, और संदर्भ की समझ और वॉइस जनरेशन में भावनात्मक अभिव्यक्ति के लिए नए तंत्र का निर्माण किया है।
Eleven Multilingual v2 का उपयोग करके, ElevenLabs टेक्स्ट टू स्पीच प्लेटफ़ॉर्म में टेक्स्ट डालने पर,नया मॉडल स्वचालित रूप से लगभग 30 लिखित भाषाओं को पहचानता है और अभूतपूर्व स्तर की विश्वसनीयता के साथ आवाज़ उत्पन्न करता है।
साथ ही, चाहे सिंथेटिक वॉइस हो या क्लोन वॉइस, सभी भाषाओं में वक्ता की अनोखी आवाज़ की विशेषताएं और विशिष्ट उच्चारण बनाए रहते हैं। इसका मतलब है कि आप एक ही आवाज़ का उपयोग करके 30 विभिन्न भाषाओं में कंटेंट को जीवंत बना सकते हैं।
इसरोलआउट के बाद, प्रोफेशनल वॉइस क्लोनिंग प्लेटफ़ॉर्म पर उपलब्ध कराई गई है। इस प्रोडक्ट अपडेट को अतिरिक्त सुरक्षा और सुरक्षा सुविधाओं के साथ जारी किया गया है, जिससे यूज़र्स अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं।
वास्तव में इसे मूल आवाज़ से अलग नहीं किया जा सकता। आज की रिलीज़ का मतलब है कि आप अपनी आवाज़ का उपयोग करके लगभग 30 भाषाओं में बात कर सकते हैं जो मल्टीलिंगुअल मॉडल प्रदान करता है।
समर्थित भाषाएँ: कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बुल्गारियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, क्लासिकल अरबी, तमिल। ये अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटालियन, हिंदी, पुर्तगाली आदि पहले से उपलब्ध भाषाओं में शामिल हो गए हैं।
हाल की फीचर रिलीज़ और प्लेटफ़ॉर्म के निरंतर सुधार के बाद, ElevenLabs आज घोषणा करता है कि प्लेटफ़ॉर्म आधिकारिक रूप से बीटा से बाहर हो गया है। यह परिवर्तन 10 लाख से अधिक वैश्विक यूज़र्स को विश्वसनीय और अत्याधुनिक टूल्स प्रदान करने की कंपनी की प्रतिबद्धता का एक महत्वपूर्ण क्षण है।
आगे चलकर ElevenLabs यूज़र्स को प्लेटफ़ॉर्म पर आवाज़ साझा करने, नए ऑडियो के विकास से लाभ उठाने और मानव और AI के सहयोग के अवसरों को बढ़ावा देने के लिए तंत्र पेश करेगा।
ElevenLabs के सीईओ और सह-संस्थापक Mati Staniszewski ने कहा:
“ElevenLabsहर भाषा और आवाज़ में सभी कंटेंट को सार्वभौमिक रूप से सुलभ बनाने के सपने से शुरू हुआ। Eleven Multilingual v2की रिलीज़ के साथ, हमने इस सपने को साकार किया और सभी बोलियों में मानव गुणवत्ता कीAIआवाज़ के उपयोग के करीब एक कदम बढ़ाया।
“टेक्स्ट टू स्पीच जनरेशन टूल्स प्रतिस्पर्धा के मैदान को बराबर करते हैं और सभी क्रिएटर्स को उच्च गुणवत्ता वाली वॉइस ऑडियो सुविधाएं प्रदान करते हैं। ये लाभ अब लगभग30भाषाओं में मल्टीलिंगुअल एप्लिकेशन में विस्तारित हो रहे हैं। अंततः,AIकी मदद से, हम और अधिक भाषाओं और आवाज़ों को कवर करना चाहते हैं और कंटेंट के लिए भाषाई बाधाओं को समाप्त करना चाहते हैं। ElevenLabsमें, हम मानते हैं कि ये एक्सेसिबिलिटी की छलांग अंततः रचनात्मकता, नवाचार और विविधता को बढ़ावा देगी।”
ElevenLabs कंपनियों और क्रिएटर्स को कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, कई संस्कृतियों और भाषाओं में गूंजने वाले अधिक कल्पनाशील और सुलभ कंटेंट बनाने में सक्षम बनाता है।
स्वतंत्र गेम डेवलपर्स और पब्लिशर्सके लिए, मल्टीलिंगुअल वॉइस जनरेशन टूल्स बिना आवाज़ की गुणवत्ता या सटीकता को प्रभावित किए, खिलाड़ियों और श्रोताओं की भाषा में जुड़ने और अंतरराष्ट्रीय दर्शकों के लिए गेम अनुभव और वॉइस कंटेंट का अनुवाद करने के नए अवसर प्रदान करते हैं।
इसी तरह, शैक्षणिक संस्थानसीखने वालों को लक्षित भाषा में सटीक ऑडियो कंटेंट तुरंत प्रदान कर सकते हैं, भाषा समझ और उच्चारण कौशल को मजबूत कर सकते हैं, और विभिन्न शिक्षण शैलियों और अंतरराष्ट्रीय छात्रों की सीखने की जरूरतों को पूरा करने के साधन प्राप्त कर सकते हैं।
सभी प्रकार के क्रिएटर्स ElevenLabs के टूल्स का उपयोग करके, कई भाषाओं में उपलब्ध आवाज़ के साथ दृश्य कंटेंट को पूरक कर सकते हैं, जिससे दृष्टिबाधित या सीखने की जरूरतों वाले लोगों के लिए कंटेंट कीसुलभताको बढ़ाया जा सकता है।
जनवरी 2023 में जारी किए गए पहले AI वॉइस टूल्स सूट में विभिन्न पूर्वनिर्धारित सिंथेटिक आवाज़ें और आपकी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। मल्टीलिंगुअल वॉइस टूल्स ElevenLabs के मिशन का अगला चरण है, जो सभी कंटेंट को सभी भाषाओं और सभी आवाज़ों में सार्वभौमिक रूप से सुलभ बनाता है।
यह तकनीक पहले से ही विभिन्न रचनात्मक वर्टिकल और सेक्टरों में अपनाई जा चुकी है, जैसे कि इंडी लेखकों द्वारा ऑडियोबुक का निर्माण, वीडियो गेम में सेकेंडरी कैरेक्टर की आवाज़, दृष्टिबाधित लोगों के लिए ऑनलाइन लिखित कंटेंट तक पहुंच के लिए समर्थन, और दुनिया के पहले AI रेडियो चैनल की प्रेरणा। ElevenLabs ने AI वीडियो जनरेटरD-IDके साथ साझेदारी की है, जो दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक हैStorytel,ओपन एक्सेस साइंस वीडियो प्लेटफ़ॉर्मScienceCast जो वीडियो जनरेशन टूल्स का उपयोग करता हैarXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को संक्षेप में प्रस्तुत करने के लिए,दुनिया के अग्रणी कंटेंट क्रिएटर प्लेटफ़ॉर्मTheSoul Publishing, Embark Studios औरParadox Interactiveजैसे शानदार गेम डेवलपर्स, और मीडिया प्लेटफ़ॉर्मMNTNआदि के साथ विभिन्न शीर्ष कंटेंट निर्माताओं, स्टूडियो के साथ साझेदारी की है।
Japanese actors and voice actors can now mark their voices as authorized for AI use
Multi-agent voice assistants achieve 40% automated resolution and 30% CSAT lift
ElevenLabs द्वारा संचालित एजेंट्स