कॉन्टेंट पर जाएं

ElevenLabs ने $2M जुटाए और AI स्पीच प्लेटफ़ॉर्म की घोषणा की जो ऑडियो स्टोरीटेलिंग में क्रांति लाने का वादा करता है

प्रकाशित

सुनेंइस आर्टिकल को सुनें

  • ElevenLabs ने बीटा प्लेटफ़ॉर्म लॉन्च किया, जिससे क्रिएटर्स और पब्लिशर्स अपने लंबे फॉर्मेट के कंटेंट को नैरेट कर सकते हैं
  • प्री-सीड फंडिंग राउंड का नेतृत्व Credo Ventures ने किया, जिसमें Concept Ventures और व्यक्तिगत निवेशकों ने भी भाग लिया
  • पूंजी AI के रिसर्च और डेवलपमेंट को आगे बढ़ाएगी


2023-01-23, लंदन, यूके |ElevenLabs, एक AI वॉइस टेक्नोलॉजी स्टार्टअप, जीवन्त स्पीच सिंथेसिस टूल्स बना रहा है जिसका दीर्घकालिक लक्ष्य भाषाओं के बीच बोले गए ऑडियो को तुरंत बदलना है। आज, उन्होंने Credo Ventures के नेतृत्व में $2 मिलियन की प्री-सीड फंडिंग राउंड के बाद अपना बीटा प्लेटफ़ॉर्म लॉन्च करने की घोषणा की, जिसमें Concept Ventures और अन्य व्यक्तिगत निवेशकों ने भी भाग लिया।

हमारा प्लेटफ़ॉर्म क्रिएटर्स और पब्लिशर्स को लंबी सामग्री सुनाने और ऑडियो फॉर्मेट में विस्तार करने की सुविधा देता है। इसकी सभी सुविधाएँ हमारे खुद के बनाए डीप लर्निंग मॉडल से चलती हैं, जो स्पीच सिंथेसिस के लिए इंसानी आवाज़ की टोन और उतार-चढ़ाव को असली जैसा बनाता है, और संदर्भ के हिसाब से डिलीवरी को एडजस्ट कर सकता है। ElevenLabs यूज़र्स को नए क्रिएटिव विकल्प देने के लिए

क्षमता में छलांग नवाचार की मांग करती है, यही कारण है कि ElevenLabs खुद को सबसे पहले एक अनुसंधान कंपनी मानता है। अब तक का अधिकांश अनुसंधान नए टेक्स्ट टू स्पीच मॉडल्स विकसित करने पर केंद्रित था, जो उच्च संपीड़न और संदर्भ समझ पर निर्भर करते हैं ताकि मानव भाषण को अल्ट्रा-रियलिस्टिक रूप से प्रस्तुत किया जा सके। कंपनी ने वॉइस क्लोनिंग के लिए एक नया मॉडल भी बनाया है जो बिना किसी प्रशिक्षण (बिना फाइन-ट्यूनिंग) के उच्च आउटपुट समानता प्राप्त करता है, केवल 5 सेकंड के नमूनों पर - एक उपलब्धि जो पहले कभी नहीं सुनी गई थी। डेवलपर्स इन सभी विशेषताओं तक API के माध्यम से पहुंच सकते हैं।

यह रिसर्च प्लेटफॉर्म की मौजूदा खूबियों को बेहतर बनाती है और साथ ही कंपनी के आखिरी मकसद—बोली गई ऑडियो को तुरंत अलग-अलग भाषाओं में बदलने—की ओर भी ले जाती है। हमारा AI डबिंग टूल, जो इस साल के अंत में आएगा, यूज़र्स को किसी भी ऑडियो या वीडियो को दूसरी भाषा में अपने-आप री-वॉइस करने देगा, वो भी ओरिजिनल स्पीकर की आवाज़ को बरकरार रखते हुए। शुरुआत में हम एजुकेशन सेक्टर के क्लाइंट्स को जोड़ना चाहते हैं, और हमारा लंबा लक्ष्य है कि स्ट्रीमिंग,

कंपनी के स्पीच सिंथेसिस और डबिंग टूल्स उतने ही पूरक हैं जितने कि वे समय पर हैं: दोनों ऑडियो और वीडियो को व्यापक दर्शकों तक पहुंचाने का वादा करते हैं और दोनों ऐसे समय में आते हैं जब ऑडियो स्पेस तेजी से बढ़ रहा है। शुरुआती परीक्षकों का एक समूह, जिनमें YouTube क्रिएटर्स, पब्लिशर्स और डेवलपर्स शामिल हैं, पहले से ही प्लेटफ़ॉर्म का दैनिक उपयोग कर रहे हैं ताकि वीडियो, कहानियों और पात्रों को आवाज़ दी जा सके, और कंपनी को उम्मीद है कि जेनरेटिव स्पीच के संभावित अनुप्रयोगों का क्षेत्र केवल विस्तारित होगा। समाचार पब्लिशर्स ने पहले ही पाया है कि अपनी ऑडियो उपस्थिति को बढ़ाना ग्राहकों को जोड़ने और बनाए रखने का एक शानदार तरीका है। लेकिन वॉइस ऐक्टर्स को अनुबंधित करना महंगा है, जैसे कि रिपोर्टर्स को अपनी कहानियाँ पढ़ने के लिए रखना। पुस्तक और न्यूज़लेटर लेखक, और यहां तक कि गेम डेवलपर्स, समान चुनौतियों का सामना करते हैं: पूर्व अपने काम को स्वयं नैरेट करने की ओर बढ़ रहे हैं और बाद वाले को यह तय करना होता है कि क्या कोई विशेष पात्र रिकॉर्डिंग लागत को सही ठहराता है। जो लोग मौजूदा टेक्स्ट टू स्पीच सॉफ़्टवेयर का उपयोग करते हैं, वे पैसे बचाते हैं लेकिन गुणवत्ता पर समझौता करके एक अलग कीमत चुकाते हैं। ElevenLabs जोर देता है कि अब समझौता करने की कोई आवश्यकता नहीं है क्योंकि वे क्रिएटर्स और पब्लिशर्स को सबसे उन्नत और बहुमुखी AI स्टोरीटेलिंग टूल्स से लैस करने की तैयारी कर रहे हैं।

“हम जो प्लेटफ़ॉर्म लॉन्च कर रहे हैं वह टेक्स्ट को उच्च गुणवत्ता वाले बोले गए ऑडियो में बदलने के बारे में है। हम चाहते हैं कि लोग अपनी पसंदीदा किताब या न्यूज़लेटर का आनंद लें, उन सभी लेखकों, क्रिएटर्स और डेवलपर्स को आवाज़ देकर जो इसे वहन नहीं कर सकते थे” - कहते हैं माती स्टानिस्ज़ेव्स्की, सह-संस्थापक। “हमारा अंतिम लक्ष्य है कि लोग किसी भी सामग्री का आनंद लें जो उन्हें प्रासंगिक और दिलचस्प लगे, चाहे वे कोई भी भाषा बोलते हों” - जोड़ते हैं पियोटर डाबकोव्स्की, सह-संस्थापक।

Credo Ventures में हम CEE क्षेत्र के स्मार्ट और महत्वाकांक्षी संस्थापकों के साथ काम करना चाहते हैं। हमने माती और पियोटर की आँखों में भूख और चिंगारी देखी थी हमारी पहली मुलाकात में। कुछ महीनों बाद वे OpenAI-ग्रेड स्पीच टेक्नोलॉजी रिसर्च हब बन रहे हैं जो कृत्रिम ऑडियो में सबसे बड़ी चुनौतियों को पार कर रहे हैं। उनकी सिंथेसाइज़्ड आवाज़ें पहले से ही वास्तविक से अप्रभेद्य हैं और इस सफलता ने न केवल अभूतपूर्व गुणवत्ता और निष्ठा में सामग्री उत्पन्न करने की बाधाओं को बड़े पैमाने पर कम कर दिया है, बल्कि जल्द ही यह क्रिएटर्स को बहुभाषी होकर अपनी दर्शकों को व्यापक रूप से बढ़ाने की अनुमति देगा। – कहते हैं मैकिक ग्नुटेक, जनरल पार्टनर Credo Ventures में।

मनोरंजन और व्यवसाय दोनों में सामान्य होने के बावजूद, ऑडियो को हाल के अनुसंधान में अपेक्षाकृत उपेक्षित किया गया है। हम माती और पियोटर का समर्थन करने के लिए इस जेनरेटिव AI के स्वर्ण युग में अधिक उत्साहित नहीं हो सकते, और विश्वास करते हैं कि ElevenLabs वह टीम है जो इस तकनीक को जनता तक पहुंचाएगी, एक आवाज़ में। - कहते हैं ओलिवर किक्स, प्रिंसिपल Concept Ventures में।

ElevenLabs के बारे में:
ElevenLabs एक रिसर्च कंपनी है जो क्रिएटर्स और पब्लिशर्स के लिए AI वॉइस सिंथेसिस सॉफ्टवेयर बनाती है। हमारे टूल्स बेहद नेचुरल आवाज़ में स्पीच जनरेट करते हैं और कंटेक्स्ट या यूज़र इंस्ट्रक्शन के हिसाब से टोन और इन्फ्लेक्शन बदल सकते हैं। हमारा प्लेटफॉर्म न्यूज़, न्यूज़लेटर, किताबें और वीडियो के लिए वॉइस देने में ज़रूरी क्वालिटी और फ्लेक्सिबिलिटी देने का प्रयास करता है। मुख्य फीचर्स में शामिल हैं: टेक्स्ट-बेस्ड स्पीच जेनरेशन, वॉइस क्लोनिंग,

वेंचर कैपिटल द्वारा प्रदान किया गया Credo Ventures और Concept Ventures. व्यक्तिगत निवेशकों में शामिल हैं पीटर चज़बान, टाइटस सिटोव्स्की, टाल्फन इवांस, डॉ. फातिमा गोडाल, टोमाज़ कारवाटका, पियोटर कारवाटका, अखिल पॉल, बार्टेक पुसेक, मार्टा पिरज़िक, कार्ल्स रेना, परिन शाह, चार्ली सॉन्गहर्स्ट और हैरी सॉन्गहर्स्ट।

संपर्क करें
press@elevenlabs.io

संबंधित लेख

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं