- ElevenLabs ने एक $80m सीरीज़ B राउंड उठाया है, जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital और Credo Ventures ताकि वॉइस AI में अपनी स्थिति को मजबूत कर सके।
- कंपनी आज कुछ नए प्रोडक्ट्स का भी खुलासा कर रही है, जिनमें शामिल हैं Dubbing Studio, वॉइस लाइब्रेरी मार्केटप्लेस, एक प्रारंभिक पूर्वावलोकन मोबाइल रीडर ऐप, और नए मॉडल जिनमें बेहतर गति और भाषा कवरेज है।
- लॉन्च के बाद से, ElevenLabs की तकनीक ने क्रिएटर इकोनॉमी, पब्लिशिंग, कन्वर्सेशनल AI, एंटरटेनमेंट, शिक्षा और एक्सेसिबिलिटी जैसे क्षेत्रों में वैश्विक स्तर पर कंटेंट एक्सेसिबिलिटी में सुधार किया है, जिससे कंपनी को यूनिकॉर्न स्थिति प्राप्त हुई।
22 जनवरी / ग्लोबल - ElevenLabs, एक वॉइस टेक्नोलॉजी रिसर्च कंपनी, ने $80m सीरीज़ B राउंड उठाया है जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital और Credo Ventures, ताकि वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में अपनी स्थिति को मजबूत कर सके।
सार्वजनिक लॉन्च के बाद से, ElevenLabs ने प्राकृतिक भाषण संश्लेषण में उद्योग का नेतृत्व किया है, जिससे यूज़र्स को विभिन्न भाषाओं और उच्चारणों में AI वॉइस बनाने और डिज़ाइन करने की सुविधा मिली है, जिसमें भावनाओं और स्वर की एक विस्तृत श्रृंखला देने की क्षमता है। लॉन्च के बाद से, ElevenLabs के यूज़र्स ने 100 साल का ऑडियो जनरेट किया है, जबकि कंपनी 5 से 40 कर्मचारियों तक बढ़ी है। आज, ElevenLabs की तकनीक का उपयोग 41% फॉर्च्यून 500 कंपनियों के कर्मचारियों द्वारा किया जा रहा है।
ElevenLabs की तकनीक को कई वर्टिकल्स में अपनाया गया है। इसने क्रिएटर्स को वॉइसओवर और AI डबिंग के साथ ऑडियंस अनुभव को बढ़ाने, शिक्षा तक पहुंच को व्यापक बनाने और ऑडियोबुक पब्लिशिंग, एंटरटेनमेंट और व्यक्तिगत उपयोग में नवाचार समाधान प्रदान करने में सक्षम बनाया है, जिसमें एक्सेसिबिलिटी में सुधार शामिल है। यह फंडिंग कंपनी के प्रोडक्ट ऑफरिंग को और परिष्कृत करने के लिए उपयोग की जाएगी, जबकि AI तकनीक की सुरक्षित डिप्लॉयमेंट सुनिश्चित करेगी।
आज की सीरीज़ B घोषणा के अलावा, ElevenLabs कई नए प्रोडक्ट डेवलपमेंट्स का भी अनावरण कर रहा है, जो आने वाले हफ्तों में लाइव होंगे:
- एक नया Dubbing Studio वर्कफ़्लो यूज़र्स को पूरी फिल्में डब करने, साथ ही उनके ट्रांसक्रिप्ट्स, अनुवाद और टाइमकोड्स को जनरेट और एडिट करने की सुविधा देता है, जिससे कंटेंट प्रोडक्शन पर अतिरिक्त नियंत्रण मिलता है। ये क्षमताएं पहले से मौजूद AI डबिंग फीचर को पूरक करती हैं जो 29 भाषाओं में स्वचालित, एंड-टू-एंड वीडियो लोकलाइजेशन सक्षम करती हैं।
- एक वॉइस लाइब्रेरी मार्केटप्लेस जो यूज़र्स को अपनी खुद की आवाज़ों के AI वर्जन से कमाई करने के लिए एक सुरक्षित प्लेटफ़ॉर्म प्रदान करेगा। यूज़र्स अपनी प्रोफेशनल AI वॉइस प्रतिकृति बना सकते हैं, उसे सत्यापित कर सकते हैं, और वॉइस लाइब्रेरी के माध्यम से साझा कर सकते हैं। जब अन्य लोग इन सत्यापित आवाज़ों का उपयोग करते हैं, तो मूल क्रिएटर्स को मुआवजा मिलता है। यूज़र्स हमेशा अपनी आवाज़ की उपलब्धता और मुआवजा शर्तों पर नियंत्रण रखते हैं। मार्केटप्लेस पहले से ही एक छोटे समूह के अल्फा-यूज़र्स के लिए आय उत्पन्न कर रहा है।
- मोबाइल ऐप का प्रारंभिक पूर्वावलोकन रीडर जो टेक्स्ट और URLs को ऑडियो में तुरंत बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में कंटेंट एक्सेस करना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीनों के लिए मुफ्त में उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से प्रारंभिक एक्सेस के लिए पंजीकरण कर सकेंगे।यह टेक्स्ट और URLs को तुरंत ऑडियो में बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में सामग्री तक पहुंचना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीने के लिए मुफ़्त उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से जल्दी एक्सेस के लिए रजिस्टर कर सकेंगे।
2023 के दौरान, ElevenLabs ने पब्लिशिंग, गेमिंग, मीडिया और कन्वर्सेशनल वर्टिकल्स सहित कई क्षेत्रों में अपनी उपस्थिति का विस्तार किया है, साथ ही प्रमुख मीडिया हाउसों के साथ B2B साझेदारियाँ की हैं, जिनमें शामिल हैं:
- पब्लिशिंग: Storytel, The Washington Post, Rheinische Post, Curio
- Conversational AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
- मीडिया और एंटरटेनमेंट: Wondershare Filmora, Futuri Media, TheSoul Publishing
- गेमिंग: Paradox Interactive, NetEase, Inworld AI
ये नवीनतम प्रोडक्ट लॉन्च और साझेदारियाँ उस अवधि का अनुसरण करती हैं जिसमें ElevenLabs ने लगातार अपने टूल्स के सूट का विस्तार किया है, सभी इन-हाउस रिसर्च से विकसित। रिलीज़ में शामिल हैं: स्पीच सिंथेसिस के लिए जीवन्त टेक्स्ट टू स्पीच रूपांतरण, साथ ही लेटेंसी के लिए अनुकूलित एक टर्बो मॉडल; वॉइस डिज़ाइन और वॉइस क्लोनिंग कस्टम वॉइस बनाने के लिए; Speech to Speech एक आवाज़ को दूसरी में बदलने के लिए। कंपनी ने अपनी इंडस्ट्री-लीडिंग AI Dubbing टूल भी जारी किया, जो ऑडियो और वीडियो को 29 भाषाओं में स्वचालित रूप से अनुवाद करने में सक्षम है, जबकि मूल वक्ता की आवाज़ और भावनाओं को संरक्षित करता है। कंपनी जल्द ही टर्बो और स्पीच टू स्पीच मॉडल का विस्तार करेगी, जो वर्तमान में अंग्रेजी में उपलब्ध हैं, को अधिक भाषाओं के लिए।
इन फीचर्स को पावर देने वाले रिसर्च के आधार पर, ElevenLabs ने अधिक जटिल वर्कफ़्लो के लिए उन्नत टूल्स पर भी काम किया है, जैसे स्टूडियो पब्लिशिंग के लिए, और Dubbing Studio वीडियो लोकलाइजेशन के लिए। स्टूडियो संपादन, संरचना, नेविगेशन और प्रकाशकों के लिए लंबे फॉर्मेट के कंटेंट को जनरेट करने को सरल बनाता है, और Dubbing Studio ट्रांसक्रिप्ट, अनुवाद और अनुक्रम समय पर नियंत्रण प्रदान करके वैश्विक दर्शकों के लिए कंटेंट तैयार करने में मदद करता है।
कंपनी ने समुदाय-उन्मुख प्रोडक्ट्स भी विकसित किए हैं जैसे Voice Library - AI-जनित आवाज़ों को साझा करने के लिए एक वातावरण। पहले वॉइस डिज़ाइन टूल के साथ बनाई गई कृत्रिम आवाज़ों को साझा करने तक सीमित, वॉइस लाइब्रेरी अब यूज़र्स को अपनी स्वयं की सत्यापित वॉइस प्रतिकृतियाँ साझा करने की अनुमति देती है, जो प्रोफेशनल वॉइस क्लोनिंग के साथ बनाई गई हैं, और जब अन्य उनका उपयोग करते हैं तो पैसे कमाते हैं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च-गुणवत्ता वाली वॉइस प्रतिकृतियाँ बनाता है। आवाज़ साझा करने से पहले, यूज़र्स को एक वॉइस कैप्चा सत्यापन पास करना होगा, जिसमें एक विशिष्ट समय सीमा के भीतर एक टेक्स्ट प्रॉम्प्ट पढ़ना होता है ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, प्रामाणिक, यूज़र-सत्यापित आवाज़ों को साझा और मुद्रीकृत करने को सुनिश्चित करती है, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।वॉइस लाइब्रेरी मार्केटप्लेस में, और जब अन्य लोग उनका उपयोग करते हैं तो पैसे कमाएं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च गुणवत्ता वाली वॉइस प्रतिकृतियां बनाता है। वॉइस साझा करने से पहले, यूज़र्स को एक विशिष्ट समय सीमा के भीतर टेक्स्ट प्रॉम्प्ट पढ़कर वॉइस कैप्चा सत्यापन पास करना होगा ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, सुनिश्चित करती है कि प्रामाणिक, यूज़र-प्रमाणित आवाज़ें साझा और मुद्रीकृत की जाती हैं, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।
ElevenLabs के लिए एक मुख्य प्राथमिकता AI का सुरक्षित और जिम्मेदार विकास है, जिसमें यह सुनिश्चित करने के लिए पहचान सक्षम करना शामिल है कि सभी AI-जनित कंटेंट स्पष्ट रूप से पहचाने जा सकें। कंपनी ने एक AI स्पीच क्लासिफायर पिछले साल लॉन्च किया; एक टूल जो यह सत्यापित कर सकता है कि कोई ऑडियो सैंपल ElevenLabs जनित कंटेंट है या नहीं। इस साल, कंपनी क्लासिफायर की क्षमताओं को अधिक वॉइस AI मॉडल्स को कवर करने के लिए बढ़ाने पर काम करेगी, साथ ही व्यापक कार्यान्वयन के लिए अन्य वितरण प्लेटफार्मों के साथ साझेदारी करेगी। ElevenLabs सार्वजनिक डोमेन में सुरक्षा बढ़ाने के लिए अतिरिक्त सुरक्षा उपायों का सक्रिय रूप से विकास कर रहा है।
इस सीरीज़ B निवेश के साथ, ElevenLabs का इरादा वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में वैश्विक नेता के रूप में अपनी स्थिति को मजबूत करने का है। पूंजी का उपयोग अनुसंधान को आगे बढ़ाने, बुनियादी ढांचे का विस्तार करने, विशिष्ट वर्टिकल्स के लिए नए प्रोडक्ट्स विकसित करने और AI तकनीक के जिम्मेदार और नैतिक विकास को सुनिश्चित करने के लिए सुरक्षा उपायों को बढ़ाने में किया जाएगा।
Piotr Dąbkowski, ElevenLabs के CTO, कहते हैं:
“हमारी टीम की प्रतिबद्धता ने पहले ही वॉइस AI पर एक स्थायी प्रभाव डाला है। यह नई फंडिंग हमें और भी बड़े चैलेंज लेने और रिसर्च और प्रोडक्ट डेवलपमेंट में अपनी प्रतिस्पर्धात्मक बढ़त बनाए रखने पर ध्यान केंद्रित करने की अनुमति देती है।”
Mati Staniszewski निष्कर्ष निकालते हैं:
“हमारी महत्वाकांक्षा वही रहती है – भाषा और संचार बाधाओं को तोड़कर हम कंटेंट के साथ कैसे इंटरैक्ट करते हैं, इसे बदलना। हम अत्याधुनिक तकनीक का निर्माण कर रहे हैं ताकि कंटेंट को भाषाओं और आवाज़ों के पार एक्सेस किया जा सके - और हर किसी को उन सूचनाओं और कहानियों से जुड़ने में सक्षम बनाया जा सके जो मायने रखती हैं। अब तक की हमारी प्रगति हमारी समर्पित टीम और निवेशकों का प्रमाण है, और जबकि यह हमारी यात्रा की केवल शुरुआत है, हम मिलकर एक्सेसिबिलिटी और संचार के भविष्य को आकार देने में मदद कर रहे हैं।”