- ElevenLabs ने एक $80m सीरीज़ B राउंड उठाया है, जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital और Credo Ventures ताकि वॉइस AI में अपनी स्थिति को मजबूत कर सके।
- कंपनी आज कुछ नए प्रोडक्ट्स का भी खुलासा कर रही है, जिनमें शामिल हैं Dubbing Studio, वॉइस लाइब्रेरी मार्केटप्लेस, एक प्रारंभिक पूर्वावलोकन मोबाइल रीडर ऐप, और नए मॉडल जिनमें बेहतर गति और भाषा कवरेज है।
- लॉन्च के बाद से, ElevenLabs की तकनीक ने क्रिएटर इकोनॉमी, पब्लिशिंग, कन्वर्सेशनल AI, एंटरटेनमेंट, शिक्षा और एक्सेसिबिलिटी जैसे क्षेत्रों में वैश्विक स्तर पर कंटेंट एक्सेसिबिलिटी में सुधार किया है, जिससे कंपनी को यूनिकॉर्न स्थिति प्राप्त हुई।
22 जनवरी / ग्लोबल - ElevenLabs, एक वॉइस टेक्नोलॉजी रिसर्च कंपनी, ने $80m सीरीज़ B राउंड उठाया है जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital और Credo Ventures, ताकि वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में अपनी स्थिति को मजबूत कर सके।
सार्वजनिक लॉन्च के बाद से, ElevenLabs ने प्राकृतिक भाषण संश्लेषण में उद्योग का नेतृत्व किया है, जिससे यूज़र्स को विभिन्न भाषाओं और उच्चारणों में AI वॉइस बनाने और डिज़ाइन करने की सुविधा मिली है, जिसमें भावनाओं और स्वर की एक विस्तृत श्रृंखला देने की क्षमता है। लॉन्च के बाद से, ElevenLabs के यूज़र्स ने 100 साल का ऑडियो जनरेट किया है, जबकि कंपनी 5 से 40 कर्मचारियों तक बढ़ी है। आज, ElevenLabs की तकनीक का उपयोग 41% फॉर्च्यून 500 कंपनियों के कर्मचारियों द्वारा किया जा रहा है।
ElevenLabs की तकनीक को कई वर्टिकल्स में अपनाया गया है। इसने क्रिएटर्स को वॉइसओवर और AI डबिंग के साथ ऑडियंस अनुभव को बढ़ाने, शिक्षा तक पहुंच को व्यापक बनाने और ऑडियोबुक पब्लिशिंग, एंटरटेनमेंट और व्यक्तिगत उपयोग में नवाचार समाधान प्रदान करने में सक्षम बनाया है, जिसमें एक्सेसिबिलिटी में सुधार शामिल है। यह फंडिंग कंपनी के प्रोडक्ट ऑफरिंग को और परिष्कृत करने के लिए उपयोग की जाएगी, जबकि AI तकनीक की सुरक्षित डिप्लॉयमेंट सुनिश्चित करेगी।
आज की सीरीज़ B घोषणा के अलावा, ElevenLabs कई नए प्रोडक्ट डेवलपमेंट्स का भी अनावरण कर रहा है, जो आने वाले हफ्तों में लाइव होंगे:
- एक नया Dubbing Studio वर्कफ़्लो यूज़र्स को पूरी फिल्में डब करने, साथ ही उनके ट्रांसक्रिप्ट्स, अनुवाद और टाइमकोड्स को जनरेट और एडिट करने की सुविधा देता है, जिससे कंटेंट प्रोडक्शन पर अतिरिक्त नियंत्रण मिलता है। ये क्षमताएं पहले से मौजूद AI डबिंग फीचर को पूरक करती हैं जो 29 भाषाओं में स्वचालित, एंड-टू-एंड वीडियो लोकलाइजेशन सक्षम करती हैं।
- एक वॉइस लाइब्रेरी मार्केटप्लेस जो यूज़र्स को अपनी खुद की आवाज़ों के AI वर्जन से कमाई करने के लिए एक सुरक्षित प्लेटफ़ॉर्म प्रदान करेगा। यूज़र्स अपनी प्रोफेशनल AI वॉइस प्रतिकृति बना सकते हैं, उसे सत्यापित कर सकते हैं, और वॉइस लाइब्रेरी के माध्यम से साझा कर सकते हैं। जब अन्य लोग इन सत्यापित आवाज़ों का उपयोग करते हैं, तो मूल क्रिएटर्स को मुआवजा मिलता है। यूज़र्स हमेशा अपनी आवाज़ की उपलब्धता और मुआवजा शर्तों पर नियंत्रण रखते हैं। मार्केटप्लेस पहले से ही एक छोटे समूह के अल्फा-यूज़र्स के लिए आय उत्पन्न कर रहा है।
- मोबाइल ऐप का प्रारंभिक पूर्वावलोकन रीडर जो टेक्स्ट और URLs को ऑडियो में तुरंत बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में कंटेंट एक्सेस करना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीनों के लिए मुफ्त में उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से प्रारंभिक एक्सेस के लिए पंजीकरण कर सकेंगे।enables instant conversion of text and URLs into audio, making it easier for users to access content in another medium while on the move. As an introductory trial, the app will be available free of charge for the first three months and users will be able to register for early access through a waiting list.
2023 के दौरान, ElevenLabs ने पब्लिशिंग, गेमिंग, मीडिया और कन्वर्सेशनल वर्टिकल्स सहित कई क्षेत्रों में अपनी उपस्थिति का विस्तार किया है, साथ ही प्रमुख मीडिया हाउसों के साथ B2B साझेदारियाँ की हैं, जिनमें शामिल हैं:
- पब्लिशिंग: Storytel, The Washington Post, Rheinische Post, Curio
- Conversational AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
- मीडिया और एंटरटेनमेंट: Wondershare Filmora, Futuri Media, TheSoul Publishing
- गेमिंग: Paradox Interactive, NetEase, Inworld AI
ये नवीनतम प्रोडक्ट लॉन्च और साझेदारियाँ उस अवधि का अनुसरण करती हैं जिसमें ElevenLabs ने लगातार अपने टूल्स के सूट का विस्तार किया है, सभी इन-हाउस रिसर्च से विकसित। रिलीज़ में शामिल हैं: स्पीच सिंथेसिस के लिए जीवन्त टेक्स्ट टू स्पीच रूपांतरण, साथ ही लेटेंसी के लिए अनुकूलित एक टर्बो मॉडल; वॉइस डिज़ाइन और वॉइस क्लोनिंग कस्टम वॉइस बनाने के लिए; Speech to Speech एक आवाज़ को दूसरी में बदलने के लिए। कंपनी ने अपनी इंडस्ट्री-लीडिंग AI Dubbing टूल भी जारी किया, जो ऑडियो और वीडियो को 29 भाषाओं में स्वचालित रूप से अनुवाद करने में सक्षम है, जबकि मूल वक्ता की आवाज़ और भावनाओं को संरक्षित करता है। कंपनी जल्द ही टर्बो और स्पीच टू स्पीच मॉडल का विस्तार करेगी, जो वर्तमान में अंग्रेजी में उपलब्ध हैं, को अधिक भाषाओं के लिए।
इन फीचर्स को पावर देने वाले रिसर्च के आधार पर, ElevenLabs ने अधिक जटिल वर्कफ़्लो के लिए उन्नत टूल्स पर भी काम किया है, जैसे स्टूडियो पब्लिशिंग के लिए, और Dubbing Studio वीडियो लोकलाइजेशन के लिए। स्टूडियो संपादन, संरचना, नेविगेशन और प्रकाशकों के लिए लंबे फॉर्मेट के कंटेंट को जनरेट करने को सरल बनाता है, और Dubbing Studio ट्रांसक्रिप्ट, अनुवाद और अनुक्रम समय पर नियंत्रण प्रदान करके वैश्विक दर्शकों के लिए कंटेंट तैयार करने में मदद करता है।
कंपनी ने समुदाय-उन्मुख प्रोडक्ट्स भी विकसित किए हैं जैसे Voice Library - AI-जनित आवाज़ों को साझा करने के लिए एक वातावरण। पहले वॉइस डिज़ाइन टूल के साथ बनाई गई कृत्रिम आवाज़ों को साझा करने तक सीमित, वॉइस लाइब्रेरी अब यूज़र्स को अपनी स्वयं की सत्यापित वॉइस प्रतिकृतियाँ साझा करने की अनुमति देती है, जो प्रोफेशनल वॉइस क्लोनिंग के साथ बनाई गई हैं, और जब अन्य उनका उपयोग करते हैं तो पैसे कमाते हैं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च-गुणवत्ता वाली वॉइस प्रतिकृतियाँ बनाता है। आवाज़ साझा करने से पहले, यूज़र्स को एक वॉइस कैप्चा सत्यापन पास करना होगा, जिसमें एक विशिष्ट समय सीमा के भीतर एक टेक्स्ट प्रॉम्प्ट पढ़ना होता है ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, प्रामाणिक, यूज़र-सत्यापित आवाज़ों को साझा और मुद्रीकृत करने को सुनिश्चित करती है, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।Voice Library marketplace, and earn money when others use them. To ensure the safety and integrity of the marketplace, ElevenLabs uses its Professional Voice Cloning technology to create high-fidelity voice replicas. Before sharing a voice, users must pass a Voice Captcha verification by reading a text prompt within a specific timeframe to confirm their voice matches the training samples. This process, along with ElevenLabs team's moderation and manual approval, ensures authentic, user-verified voices are shared and monetized, creating a more secure and trustworthy environment.
ElevenLabs के लिए एक मुख्य प्राथमिकता AI का सुरक्षित और जिम्मेदार विकास है, जिसमें यह सुनिश्चित करने के लिए पहचान सक्षम करना शामिल है कि सभी AI-जनित कंटेंट स्पष्ट रूप से पहचाने जा सकें। कंपनी ने एक AI स्पीच क्लासिफायर पिछले साल लॉन्च किया; एक टूल जो यह सत्यापित कर सकता है कि कोई ऑडियो सैंपल ElevenLabs जनित कंटेंट है या नहीं। इस साल, कंपनी क्लासिफायर की क्षमताओं को अधिक वॉइस AI मॉडल्स को कवर करने के लिए बढ़ाने पर काम करेगी, साथ ही व्यापक कार्यान्वयन के लिए अन्य वितरण प्लेटफार्मों के साथ साझेदारी करेगी। ElevenLabs सार्वजनिक डोमेन में सुरक्षा बढ़ाने के लिए अतिरिक्त सुरक्षा उपायों का सक्रिय रूप से विकास कर रहा है।
इस सीरीज़ B निवेश के साथ, ElevenLabs का इरादा वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में वैश्विक नेता के रूप में अपनी स्थिति को मजबूत करने का है। पूंजी का उपयोग अनुसंधान को आगे बढ़ाने, बुनियादी ढांचे का विस्तार करने, विशिष्ट वर्टिकल्स के लिए नए प्रोडक्ट्स विकसित करने और AI तकनीक के जिम्मेदार और नैतिक विकास को सुनिश्चित करने के लिए सुरक्षा उपायों को बढ़ाने में किया जाएगा।
Piotr Dąbkowski, ElevenLabs के CTO, कहते हैं:
“हमारी टीम की प्रतिबद्धता ने पहले ही वॉइस AI पर एक स्थायी प्रभाव डाला है। यह नई फंडिंग हमें और भी बड़े चैलेंज लेने और रिसर्च और प्रोडक्ट डेवलपमेंट में अपनी प्रतिस्पर्धात्मक बढ़त बनाए रखने पर ध्यान केंद्रित करने की अनुमति देती है।”
Mati Staniszewski निष्कर्ष निकालते हैं:
“हमारी महत्वाकांक्षा वही रहती है – भाषा और संचार बाधाओं को तोड़कर हम कंटेंट के साथ कैसे इंटरैक्ट करते हैं, इसे बदलना। हम अत्याधुनिक तकनीक का निर्माण कर रहे हैं ताकि कंटेंट को भाषाओं और आवाज़ों के पार एक्सेस किया जा सके - और हर किसी को उन सूचनाओं और कहानियों से जुड़ने में सक्षम बनाया जा सके जो मायने रखती हैं। अब तक की हमारी प्रगति हमारी समर्पित टीम और निवेशकों का प्रमाण है, और जबकि यह हमारी यात्रा की केवल शुरुआत है, हम मिलकर एक्सेसिबिलिटी और संचार के भविष्य को आकार देने में मदद कर रहे हैं।”