- ElevenLabs ने एक $80m सीरीज़ B राउंड उठाया है, जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital और Credo Ventures ताकि वॉइस AI में अपनी स्थिति को मजबूत कर सके।
- कंपनी आज कुछ नए प्रोडक्ट्स का भी खुलासा कर रही है, जिनमें शामिल हैं डबिंग स्टूडियो, वॉइस लाइब्रेरी मार्केटप्लेस, एक प्रारंभिक पूर्वावलोकन मोबाइल रीडर ऐप, और नए मॉडल जिनमें बेहतर गति और भाषा कवरेज है।
- लॉन्च के बाद से, ElevenLabs की तकनीक ने क्रिएटर इकोनॉमी, पब्लिशिंग, कन्वर्सेशनल AI, एंटरटेनमेंट, शिक्षा और एक्सेसिबिलिटी जैसे क्षेत्रों में वैश्विक स्तर पर कंटेंट एक्सेसिबिलिटी में सुधार किया है, जिससे कंपनी को यूनिकॉर्न स्थिति प्राप्त हुई।
22 जनवरी / ग्लोबल - ElevenLabs, एक वॉइस टेक्नोलॉजी रिसर्च कंपनी, ने $80m सीरीज़ B राउंड उठाया है जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital और Credo Ventures, ताकि वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में अपनी स्थिति को मजबूत कर सके।
अपने सार्वजनिक लॉन्च के बाद से, ElevenLabs ने प्राकृतिक भाषण संश्लेषण में उद्योग का नेतृत्व किया है, जिससे यूज़र्स को बनाने और डिज़ाइन करने की सुविधा मिली है 100 साल विभिन्न भाषाओं और लहजों में, जो कई तरह की भावनाओं और स्वर प्रदान करने में सक्षम हैं। लॉन्च के बाद से, ElevenLabs के यूज़र्स ने 100 वर्षों का ऑडियो जनरेट किया है, जबकि कंपनी 5 से बढ़कर 40 कर्मचारियों तक पहुंच गई है। आज, ElevenLabs की तकनीक का उपयोग
ElevenLabs की तकनीक को कई वर्टिकल्स में अपनाया गया है। इसने क्रिएटर्स को वॉइसओवर और AI डबिंग के साथ ऑडियंस अनुभव को बढ़ाने, शिक्षा तक पहुंच को व्यापक बनाने और ऑडियोबुक पब्लिशिंग, एंटरटेनमेंट और व्यक्तिगत उपयोग में नवाचार समाधान प्रदान करने में सक्षम बनाया है, जिसमें एक्सेसिबिलिटी में सुधार शामिल है। यह फंडिंग कंपनी के प्रोडक्ट ऑफरिंग को और परिष्कृत करने के लिए उपयोग की जाएगी, जबकि AI तकनीक की सुरक्षित डिप्लॉयमेंट सुनिश्चित करेगी।
आज की सीरीज़ B घोषणा के अलावा, ElevenLabs कई नए प्रोडक्ट डेवलपमेंट्स का भी अनावरण कर रहा है, जो आने वाले हफ्तों में लाइव होंगे:
- एक नया डबिंग स्टूडियो वर्कफ़्लो यूज़र्स को पूरी फिल्में डब करने, साथ ही उनके ट्रांसक्रिप्ट्स, अनुवाद और टाइमकोड्स को जनरेट और एडिट करने की सुविधा देता है, जिससे कंटेंट प्रोडक्शन पर अतिरिक्त नियंत्रण मिलता है। ये क्षमताएं पहले से मौजूद AI डबिंग फीचर को पूरक करती हैं जो 29 भाषाओं में स्वचालित, एंड-टू-एंड वीडियो लोकलाइजेशन सक्षम करती हैं।
- एक वॉइस लाइब्रेरी मार्केटप्लेस जो यूज़र्स को अपनी खुद की आवाज़ों के AI वर्जन से कमाई करने के लिए एक सुरक्षित प्लेटफ़ॉर्म प्रदान करेगा। यूज़र्स अपनी प्रोफेशनल AI वॉइस प्रतिकृति बना सकते हैं, उसे सत्यापित कर सकते हैं, और वॉइस लाइब्रेरी के माध्यम से साझा कर सकते हैं। जब अन्य लोग इन सत्यापित आवाज़ों का उपयोग करते हैं, तो मूल क्रिएटर्स को मुआवजा मिलता है। यूज़र्स हमेशा अपनी आवाज़ की उपलब्धता और मुआवजा शर्तों पर नियंत्रण रखते हैं। मार्केटप्लेस पहले से ही एक छोटे समूह के अल्फा-यूज़र्स के लिए आय उत्पन्न कर रहा है।
- मोबाइल ऐप का प्रारंभिक पूर्वावलोकन रीडर जो टेक्स्ट और URLs को ऑडियो में तुरंत बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में कंटेंट एक्सेस करना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीनों के लिए मुफ्त में उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से प्रारंभिक एक्सेस के लिए पंजीकरण कर सकेंगे।यह टेक्स्ट और URLs को तुरंत ऑडियो में बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में सामग्री तक पहुंचना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीने के लिए मुफ़्त उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से जल्दी एक्सेस के लिए रजिस्टर कर सकेंगे।
2023 के दौरान, ElevenLabs ने पब्लिशिंग, गेमिंग, मीडिया और कन्वर्सेशनल वर्टिकल्स सहित कई क्षेत्रों में अपनी उपस्थिति का विस्तार किया है, साथ ही प्रमुख मीडिया हाउसों के साथ B2B साझेदारियाँ की हैं, जिनमें शामिल हैं:
- पब्लिशिंग: Storytel, The Washington Post, Rheinische Post, Curio
- कन्वर्सेशनल AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
- मीडिया और एंटरटेनमेंट: Wondershare Filmora, Futuri Media, TheSoul Publishing
- गेमिंग: Paradox Interactive, NetEase, Inworld AI
ये नवीनतम प्रोडक्ट लॉन्च और साझेदारियाँ उस अवधि का अनुसरण करती हैं जिसमें ElevenLabs ने लगातार अपने टूल्स के सूट का विस्तार किया है, सभी इन-हाउस रिसर्च से विकसित। रिलीज़ में शामिल हैं: स्पीच सिंथेसिस के लिए जीवन्त टेक्स्ट टू स्पीच रूपांतरण, साथ ही लेटेंसी के लिए अनुकूलित एक टर्बो मॉडल; वॉइस डिज़ाइन और वॉइस क्लोनिंग कस्टम वॉइस बनाने के लिए; स्पीच टू स्पीच एक आवाज़ को दूसरी में बदलने के लिए। कंपनी ने अपनी इंडस्ट्री-लीडिंग AI डबिंग टूल भी जारी किया, जो ऑडियो और वीडियो को 29 भाषाओं में स्वचालित रूप से अनुवाद करने में सक्षम है, जबकि मूल वक्ता की आवाज़ और भावनाओं को संरक्षित करता है। कंपनी जल्द ही टर्बो और स्पीच टू स्पीच मॉडल का विस्तार करेगी, जो वर्तमान में अंग्रेजी में उपलब्ध हैं, को अधिक भाषाओं के लिए।
इन फीचर्स को पावर देने वाले रिसर्च के आधार पर, ElevenLabs ने अधिक जटिल वर्कफ़्लो के लिए उन्नत टूल्स पर भी काम किया है, जैसे स्टूडियो पब्लिशिंग के लिए, और डबिंग स्टूडियो वीडियो लोकलाइजेशन के लिए। स्टूडियो संपादन, संरचना, नेविगेशन और प्रकाशकों के लिए लंबे फॉर्मेट के कंटेंट को जनरेट करने को सरल बनाता है, और डबिंग स्टूडियो ट्रांसक्रिप्ट, अनुवाद और अनुक्रम समय पर नियंत्रण प्रदान करके वैश्विक दर्शकों के लिए कंटेंट तैयार करने में मदद करता है।
कंपनी ने समुदाय-उन्मुख प्रोडक्ट्स भी विकसित किए हैं जैसे वॉइस लाइब्रेरी - AI-जनित आवाज़ों को साझा करने के लिए एक वातावरण। पहले वॉइस डिज़ाइन टूल के साथ बनाई गई कृत्रिम आवाज़ों को साझा करने तक सीमित, वॉइस लाइब्रेरी अब यूज़र्स को अपनी स्वयं की सत्यापित वॉइस प्रतिकृतियाँ साझा करने की अनुमति देती है, जो प्रोफेशनल वॉइस क्लोनिंग के साथ बनाई गई हैं, और जब अन्य उनका उपयोग करते हैं तो पैसे कमाते हैं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च-गुणवत्ता वाली वॉइस प्रतिकृतियाँ बनाता है। आवाज़ साझा करने से पहले, यूज़र्स को एक वॉइस कैप्चा सत्यापन पास करना होगा, जिसमें एक विशिष्ट समय सीमा के भीतर एक टेक्स्ट प्रॉम्प्ट पढ़ना होता है ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, प्रामाणिक, यूज़र-सत्यापित आवाज़ों को साझा और मुद्रीकृत करने को सुनिश्चित करती है, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।वॉइस लाइब्रेरी मार्केटप्लेस में, और जब अन्य लोग उनका उपयोग करते हैं तो पैसे कमाएं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च गुणवत्ता वाली वॉइस प्रतिकृतियां बनाता है। वॉइस साझा करने से पहले, यूज़र्स को एक विशिष्ट समय सीमा के भीतर टेक्स्ट प्रॉम्प्ट पढ़कर वॉइस कैप्चा सत्यापन पास करना होगा ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, सुनिश्चित करती है कि प्रामाणिक, यूज़र-प्रमाणित आवाज़ें साझा और मुद्रीकृत की जाती हैं, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।
ElevenLabs के लिए एक मुख्य प्राथमिकता AI का सुरक्षित और जिम्मेदार विकास है, जिसमें यह सुनिश्चित करने के लिए पहचान सक्षम करना शामिल है कि सभी AI-जनित कंटेंट स्पष्ट रूप से पहचाने जा सकें। कंपनी ने एक AI स्पीच क्लासिफायर पिछले साल लॉन्च किया; एक टूल जो यह सत्यापित कर सकता है कि कोई ऑडियो सैंपल ElevenLabs जनित कंटेंट है या नहीं। इस साल, कंपनी क्लासिफायर की क्षमताओं को अधिक वॉइस AI मॉडल्स को कवर करने के लिए बढ़ाने पर काम करेगी, साथ ही व्यापक कार्यान्वयन के लिए अन्य वितरण प्लेटफार्मों के साथ साझेदारी करेगी। ElevenLabs सार्वजनिक डोमेन में सुरक्षा बढ़ाने के लिए अतिरिक्त सुरक्षा उपायों का सक्रिय रूप से विकास कर रहा है।
इस सीरीज़ B निवेश के साथ, ElevenLabs का इरादा वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में वैश्विक नेता के रूप में अपनी स्थिति को मजबूत करने का है। पूंजी का उपयोग अनुसंधान को आगे बढ़ाने, बुनियादी ढांचे का विस्तार करने, विशिष्ट वर्टिकल्स के लिए नए प्रोडक्ट्स विकसित करने और AI तकनीक के जिम्मेदार और नैतिक विकास को सुनिश्चित करने के लिए सुरक्षा उपायों को बढ़ाने में किया जाएगा।
Piotr Dąbkowski, ElevenLabs के CTO, कहते हैं:
“हमारी टीम की प्रतिबद्धता ने पहले ही वॉइस AI पर एक स्थायी प्रभाव डाला है। यह नई फंडिंग हमें और भी बड़े चैलेंज लेने और रिसर्च और प्रोडक्ट डेवलपमेंट में अपनी प्रतिस्पर्धात्मक बढ़त बनाए रखने पर ध्यान केंद्रित करने की अनुमति देती है।”
Mati Staniszewski निष्कर्ष निकालते हैं:
“हमारी महत्वाकांक्षा वही रहती है – भाषा और संचार बाधाओं को तोड़कर हम कंटेंट के साथ कैसे इंटरैक्ट करते हैं, इसे बदलना। हम अत्याधुनिक तकनीक का निर्माण कर रहे हैं ताकि कंटेंट को भाषाओं और आवाज़ों के पार एक्सेस किया जा सके - और हर किसी को उन सूचनाओं और कहानियों से जुड़ने में सक्षम बनाया जा सके जो मायने रखती हैं। अब तक की हमारी प्रगति हमारी समर्पित टीम और निवेशकों का प्रमाण है, और जबकि यह हमारी यात्रा की केवल शुरुआत है, हम मिलकर एक्सेसिबिलिटी और संचार के भविष्य को आकार देने में मदद कर रहे हैं।”