ElevenLabs ने नए वॉइस AI प्रोडक्ट्स लॉन्च किए और $80M सीरीज B जुटाई

आखिरी अपडेट 22 जन॰ 2024 • 6 मिनट पढ़ने का समय

वॉइस AI रिसर्च और प्रोडक्ट डेवलपमेंट में अपनी स्थिति मजबूत करने के लिए

A group of 25 people participating in a virtual meeting, each in their own home or office setting.

ElevenLabs ने एक $80m सीरीज़ B राउंड उठाया है, जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital और Credo Ventures ताकि वॉइस AI में अपनी स्थिति को मजबूत कर सके।
कंपनी आज कुछ नए प्रोडक्ट्स का भी खुलासा कर रही है, जिनमें शामिल हैं डबिंग स्टूडियो, वॉइस लाइब्रेरी मार्केटप्लेस, एक प्रारंभिक पूर्वावलोकन मोबाइल रीडर ऐप, और नए मॉडल जिनमें बेहतर गति और भाषा कवरेज है।
लॉन्च के बाद से, ElevenLabs की तकनीक ने क्रिएटर इकोनॉमी, पब्लिशिंग, कन्वर्सेशनल AI, एंटरटेनमेंट, शिक्षा और एक्सेसिबिलिटी जैसे क्षेत्रों में वैश्विक स्तर पर कंटेंट एक्सेसिबिलिटी में सुधार किया है, जिससे कंपनी को यूनिकॉर्न स्थिति प्राप्त हुई।

22 जनवरी / ग्लोबल - ElevenLabs, एक वॉइस टेक्नोलॉजी रिसर्च कंपनी, ने $80m सीरीज़ B राउंड उठाया है जिसका नेतृत्व किया Andreessen Horowitz, Nat Friedman, Daniel Gross, और इसमें शामिल हैं Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital और Credo Ventures, ताकि वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में अपनी स्थिति को मजबूत कर सके।

अपने सार्वजनिक लॉन्च के बाद से, ElevenLabs ने प्राकृतिक भाषण संश्लेषण में उद्योग का नेतृत्व किया है, जिससे यूज़र्स को बनाने और डिज़ाइन करने की सुविधा मिली है 100 साल विभिन्न भाषाओं और लहजों में, जो कई तरह की भावनाओं और स्वर प्रदान करने में सक्षम हैं। लॉन्च के बाद से, ElevenLabs के यूज़र्स ने 100 वर्षों का ऑडियो जनरेट किया है, जबकि कंपनी 5 से बढ़कर 40 कर्मचारियों तक पहुंच गई है। आज, ElevenLabs की तकनीक का उपयोग

ElevenLabs की तकनीक को कई वर्टिकल्स में अपनाया गया है। इसने क्रिएटर्स को वॉइसओवर और AI डबिंग के साथ ऑडियंस अनुभव को बढ़ाने, शिक्षा तक पहुंच को व्यापक बनाने और ऑडियोबुक पब्लिशिंग, एंटरटेनमेंट और व्यक्तिगत उपयोग में नवाचार समाधान प्रदान करने में सक्षम बनाया है, जिसमें एक्सेसिबिलिटी में सुधार शामिल है। यह फंडिंग कंपनी के प्रोडक्ट ऑफरिंग को और परिष्कृत करने के लिए उपयोग की जाएगी, जबकि AI तकनीक की सुरक्षित डिप्लॉयमेंट सुनिश्चित करेगी।

आज की सीरीज़ B घोषणा के अलावा, ElevenLabs कई नए प्रोडक्ट डेवलपमेंट्स का भी अनावरण कर रहा है, जो आने वाले हफ्तों में लाइव होंगे:

एक नया डबिंग स्टूडियो वर्कफ़्लो यूज़र्स को पूरी फिल्में डब करने, साथ ही उनके ट्रांसक्रिप्ट्स, अनुवाद और टाइमकोड्स को जनरेट और एडिट करने की सुविधा देता है, जिससे कंटेंट प्रोडक्शन पर अतिरिक्त नियंत्रण मिलता है। ये क्षमताएं पहले से मौजूद AI डबिंग फीचर को पूरक करती हैं जो 29 भाषाओं में स्वचालित, एंड-टू-एंड वीडियो लोकलाइजेशन सक्षम करती हैं।
एक वॉइस लाइब्रेरी मार्केटप्लेस जो यूज़र्स को अपनी खुद की आवाज़ों के AI वर्जन से कमाई करने के लिए एक सुरक्षित प्लेटफ़ॉर्म प्रदान करेगा। यूज़र्स अपनी प्रोफेशनल AI वॉइस प्रतिकृति बना सकते हैं, उसे सत्यापित कर सकते हैं, और वॉइस लाइब्रेरी के माध्यम से साझा कर सकते हैं। जब अन्य लोग इन सत्यापित आवाज़ों का उपयोग करते हैं, तो मूल क्रिएटर्स को मुआवजा मिलता है। यूज़र्स हमेशा अपनी आवाज़ की उपलब्धता और मुआवजा शर्तों पर नियंत्रण रखते हैं। मार्केटप्लेस पहले से ही एक छोटे समूह के अल्फा-यूज़र्स के लिए आय उत्पन्न कर रहा है।
मोबाइल ऐप का प्रारंभिक पूर्वावलोकन रीडर जो टेक्स्ट और URLs को ऑडियो में तुरंत बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में कंटेंट एक्सेस करना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीनों के लिए मुफ्त में उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से प्रारंभिक एक्सेस के लिए पंजीकरण कर सकेंगे।यह टेक्स्ट और URLs को तुरंत ऑडियो में बदलने की सुविधा देता है, जिससे यूज़र्स को चलते-फिरते दूसरे माध्यम में सामग्री तक पहुंचना आसान हो जाता है। एक परिचयात्मक ट्रायल के रूप में, ऐप पहले तीन महीने के लिए मुफ़्त उपलब्ध होगा और यूज़र्स वेटिंग लिस्ट के माध्यम से जल्दी एक्सेस के लिए रजिस्टर कर सकेंगे।

2023 के दौरान, ElevenLabs ने पब्लिशिंग, गेमिंग, मीडिया और कन्वर्सेशनल वर्टिकल्स सहित कई क्षेत्रों में अपनी उपस्थिति का विस्तार किया है, साथ ही प्रमुख मीडिया हाउसों के साथ B2B साझेदारियाँ की हैं, जिनमें शामिल हैं:

पब्लिशिंग: Storytel, The Washington Post, Rheinische Post, Curio
कन्वर्सेशनल AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
मीडिया और एंटरटेनमेंट: Wondershare Filmora, Futuri Media, TheSoul Publishing
गेमिंग: Paradox Interactive, NetEase, Inworld AI

ये नवीनतम प्रोडक्ट लॉन्च और साझेदारियाँ उस अवधि का अनुसरण करती हैं जिसमें ElevenLabs ने लगातार अपने टूल्स के सूट का विस्तार किया है, सभी इन-हाउस रिसर्च से विकसित। रिलीज़ में शामिल हैं: स्पीच सिंथेसिस के लिए जीवन्त टेक्स्ट टू स्पीच रूपांतरण, साथ ही लेटेंसी के लिए अनुकूलित एक टर्बो मॉडल; वॉइस डिज़ाइन और वॉइस क्लोनिंग कस्टम वॉइस बनाने के लिए; स्पीच टू स्पीच एक आवाज़ को दूसरी में बदलने के लिए। कंपनी ने अपनी इंडस्ट्री-लीडिंग AI डबिंग टूल भी जारी किया, जो ऑडियो और वीडियो को 29 भाषाओं में स्वचालित रूप से अनुवाद करने में सक्षम है, जबकि मूल वक्ता की आवाज़ और भावनाओं को संरक्षित करता है। कंपनी जल्द ही टर्बो और स्पीच टू स्पीच मॉडल का विस्तार करेगी, जो वर्तमान में अंग्रेजी में उपलब्ध हैं, को अधिक भाषाओं के लिए।

इन फीचर्स को पावर देने वाले रिसर्च के आधार पर, ElevenLabs ने अधिक जटिल वर्कफ़्लो के लिए उन्नत टूल्स पर भी काम किया है, जैसे स्टूडियो पब्लिशिंग के लिए, और डबिंग स्टूडियो वीडियो लोकलाइजेशन के लिए। स्टूडियो संपादन, संरचना, नेविगेशन और प्रकाशकों के लिए लंबे फॉर्मेट के कंटेंट को जनरेट करने को सरल बनाता है, और डबिंग स्टूडियो ट्रांसक्रिप्ट, अनुवाद और अनुक्रम समय पर नियंत्रण प्रदान करके वैश्विक दर्शकों के लिए कंटेंट तैयार करने में मदद करता है।

कंपनी ने समुदाय-उन्मुख प्रोडक्ट्स भी विकसित किए हैं जैसे वॉइस लाइब्रेरी - AI-जनित आवाज़ों को साझा करने के लिए एक वातावरण। पहले वॉइस डिज़ाइन टूल के साथ बनाई गई कृत्रिम आवाज़ों को साझा करने तक सीमित, वॉइस लाइब्रेरी अब यूज़र्स को अपनी स्वयं की सत्यापित वॉइस प्रतिकृतियाँ साझा करने की अनुमति देती है, जो प्रोफेशनल वॉइस क्लोनिंग के साथ बनाई गई हैं, और जब अन्य उनका उपयोग करते हैं तो पैसे कमाते हैं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च-गुणवत्ता वाली वॉइस प्रतिकृतियाँ बनाता है। आवाज़ साझा करने से पहले, यूज़र्स को एक वॉइस कैप्चा सत्यापन पास करना होगा, जिसमें एक विशिष्ट समय सीमा के भीतर एक टेक्स्ट प्रॉम्प्ट पढ़ना होता है ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, प्रामाणिक, यूज़र-सत्यापित आवाज़ों को साझा और मुद्रीकृत करने को सुनिश्चित करती है, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।वॉइस लाइब्रेरी मार्केटप्लेस में, और जब अन्य लोग उनका उपयोग करते हैं तो पैसे कमाएं। मार्केटप्लेस की सुरक्षा और अखंडता सुनिश्चित करने के लिए, ElevenLabs अपनी प्रोफेशनल वॉइस क्लोनिंग तकनीक का उपयोग करके उच्च गुणवत्ता वाली वॉइस प्रतिकृतियां बनाता है। वॉइस साझा करने से पहले, यूज़र्स को एक विशिष्ट समय सीमा के भीतर टेक्स्ट प्रॉम्प्ट पढ़कर वॉइस कैप्चा सत्यापन पास करना होगा ताकि यह पुष्टि हो सके कि उनकी आवाज़ प्रशिक्षण नमूनों से मेल खाती है। यह प्रक्रिया, ElevenLabs टीम की मॉडरेशन और मैनुअल अनुमोदन के साथ, सुनिश्चित करती है कि प्रामाणिक, यूज़र-प्रमाणित आवाज़ें साझा और मुद्रीकृत की जाती हैं, जिससे एक अधिक सुरक्षित और विश्वसनीय वातावरण बनता है।

ElevenLabs के लिए एक मुख्य प्राथमिकता AI का सुरक्षित और जिम्मेदार विकास है, जिसमें यह सुनिश्चित करने के लिए पहचान सक्षम करना शामिल है कि सभी AI-जनित कंटेंट स्पष्ट रूप से पहचाने जा सकें। कंपनी ने एक AI स्पीच क्लासिफायर पिछले साल लॉन्च किया; एक टूल जो यह सत्यापित कर सकता है कि कोई ऑडियो सैंपल ElevenLabs जनित कंटेंट है या नहीं। इस साल, कंपनी क्लासिफायर की क्षमताओं को अधिक वॉइस AI मॉडल्स को कवर करने के लिए बढ़ाने पर काम करेगी, साथ ही व्यापक कार्यान्वयन के लिए अन्य वितरण प्लेटफार्मों के साथ साझेदारी करेगी। ElevenLabs सार्वजनिक डोमेन में सुरक्षा बढ़ाने के लिए अतिरिक्त सुरक्षा उपायों का सक्रिय रूप से विकास कर रहा है।

इस सीरीज़ B निवेश के साथ, ElevenLabs का इरादा वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट में वैश्विक नेता के रूप में अपनी स्थिति को मजबूत करने का है। पूंजी का उपयोग अनुसंधान को आगे बढ़ाने, बुनियादी ढांचे का विस्तार करने, विशिष्ट वर्टिकल्स के लिए नए प्रोडक्ट्स विकसित करने और AI तकनीक के जिम्मेदार और नैतिक विकास को सुनिश्चित करने के लिए सुरक्षा उपायों को बढ़ाने में किया जाएगा।

Piotr Dąbkowski, ElevenLabs के CTO, कहते हैं:

“हमारी टीम की प्रतिबद्धता ने पहले ही वॉइस AI पर एक स्थायी प्रभाव डाला है। यह नई फंडिंग हमें और भी बड़े चैलेंज लेने और रिसर्च और प्रोडक्ट डेवलपमेंट में अपनी प्रतिस्पर्धात्मक बढ़त बनाए रखने पर ध्यान केंद्रित करने की अनुमति देती है।”

Mati Staniszewski निष्कर्ष निकालते हैं:

“हमारी महत्वाकांक्षा वही रहती है – भाषा और संचार बाधाओं को तोड़कर हम कंटेंट के साथ कैसे इंटरैक्ट करते हैं, इसे बदलना। हम अत्याधुनिक तकनीक का निर्माण कर रहे हैं ताकि कंटेंट को भाषाओं और आवाज़ों के पार एक्सेस किया जा सके - और हर किसी को उन सूचनाओं और कहानियों से जुड़ने में सक्षम बनाया जा सके जो मायने रखती हैं। अब तक की हमारी प्रगति हमारी समर्पित टीम और निवेशकों का प्रमाण है, और जबकि यह हमारी यात्रा की केवल शुरुआत है, हम मिलकर एक्सेसिबिलिटी और संचार के भविष्य को आकार देने में मदद कर रहे हैं।”

ElevenLabs टीम के लेखों को देखें

कंपनी

ElevenLabs ने नए जनरेटिव वॉइस AI प्रोडक्ट्स लॉन्च किए और Nat Friedman, Daniel Gross, और Andreessen Horowitz के नेतृत्व में $19 मिलियन सीरीज A राउंड की घोषणा की

ElevenLabs, एक वॉइस टेक्नोलॉजी रिसर्च कंपनी और ऑडियो AI सॉफ्टवेयर में विश्व नेता, ने अपनी वॉइस AI रिसर्च और प्रोडक्ट डिप्लॉयमेंट को जारी रखने के लिए $19 मिलियन सीरीज A जुटाए हैं - इसका मिशन सभी कंटेंट को सार्वभौमिक रूप से सुलभ बनाना है

Customer Stories

Tutore deploys conversational agents for corporate language training using ElevenLabs

90% of Tutore’s placement interviews are now conducted by AI agents, accelerating onboarding and reducing costs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

सेल्स से संपर्क करें साइन अप करें