
Introducing ElevenLabs UI: Open-source audio & agent components for the web
ElevenLabs UI is a component library to help you build multimodal agents faster.
पहला उच्च गुणवत्ता वाला लॉन्ग-फॉर्म स्पीच जनरेशन प्लेटफ़ॉर्म
इस नवंबर, हम लॉन्च कर रहे हैं पहला स्पीच सिंथेसिस प्लेटफॉर्म जो प्रकाशकों और क्रिएटर्स को उच्च गुणवत्ता वाली, भावनात्मक रूप से प्रभावशाली लंबी सामग्री बनाने की सुविधा देता है।
हमने इस दिशा को कई कारणों से चुना। वर्तमान में कोई ऐसा टूल नहीं है जो लंबी स्पीच को इतनी उच्च गुणवत्ता में जनरेट कर सके कि उसे समाचार या ऑडियोबुक के लिए उपयुक्त बनाया जा सके। हमारी टीम ऑडियो की हर चीज़ की शौकीन है और हमें लगा कि लंबी सामग्री की चुनौतियों का सामना करना हमारी महत्वाकांक्षाओं को साकार करने की एक स्वाभाविक कदम है। लेकिन हम इसे अपनी विशेषता मानकर भी उत्साहित हैं - हम पहले AI स्पीच टेक प्लेटफॉर्म हैं जो क्रिएटर्स और प्रकाशकों को सबसे भावनात्मक, समृद्ध और जीवन्त आवाज़ें प्रदान करते हैं जो सर्वोत्तम कहानी कहने की गुणवत्ता की तलाश में हैं।
इस हद तक, हमारा प्लेटफॉर्म आपको किसी भी टेक्स्ट से उच्च गुणवत्ता, वॉइस ऐक्टर-ग्रेड स्पीच जनरेट और डाउनलोड करने की सुविधा देता है - चाहे वह समाचार लेख हों, किताबें, न्यूज़लेटर्स, ब्लॉग्स या शैक्षणिक पेपर्स। आप किसी भी आवाज़ को सामग्री पढ़ने के लिए चुन सकते हैं - या तो पहले से परिभाषित सिंथेटिक आवाज़ों के सेट से, या आपके द्वारा प्रदान किए गए सैंपल से आवाज़ क्लोन करके। हमारे टेक के लिए हम जिन उपयोगों की कल्पना करते हैं वे अनंत हैं। मौजूदा सामग्री को क्रॉस-मीडियम एक्सेसिबिलिटी प्रदान करने से लेकर उत्पादकता बढ़ाने तक, या उन्हें ऑडियो में बदलकर अतीत के टेक्स्ट को पुनर्जीवित करने या नई सामग्री बनाने तक। हमारा अगला उद्देश्य अन्य भाषाओं के लिए समर्थन बढ़ाना है।
हम इसे कैसे प्राप्त करते हैं यह हमारे मॉडल के निर्माण के तरीके पर निर्भर करता है। इसे प्रशिक्षित किया गया है क्या कहा जा रहा है और उसके अनुसार डिलीवरी को समायोजित करने के लिए। यह न केवल शब्दों के अर्थ को बल्कि प्रत्येक उच्चारण के आसपास के संदर्भ को भी ध्यान में रखकर करता है।
पारंपरिक स्पीच जनरेशन एल्गोरिदम वाक्य-दर-वाक्य आधार पर उच्चारण उत्पन्न करते हैं। यह कम्प्यूटेशनली कम मांग वाला होता है लेकिन तुरंत रोबोटिक लगता है। भावनाएं और स्वर अक्सर कई वाक्यों में फैलने और गूंजने की आवश्यकता होती है ताकि एक विशेष विचारधारा को एक साथ बांधा जा सके। टोन और गति इरादे को व्यक्त करते हैं जो वास्तव में स्पीच को मानव जैसा बनाता है। इसलिए प्रत्येक उच्चारण को अलग-अलग उत्पन्न करने के बजाय, हमारा मॉडल आसपास के संदर्भ को ध्यान में रखता है, पूरे उत्पन्न सामग्री में उचित प्रवाह और प्रोसोडी बनाए रखता है। यह भावनात्मक गहराई, प्रमुख ऑडियो गुणवत्ता के साथ मिलकर, उपयोगकर्ताओं को सबसे वास्तविक और प्रभावशाली कथन उपकरण प्रदान करती है।
हमारा प्लेटफॉर्म अगले महीने लाइव होगा और आप आज ही हमारे बीटा-टेस्टर बनने के लिए पंजीकरण कर सकते हैं elevenlabs.io
यदि आप हमारे सॉफ़्टवेयर को काम करते हुए सुनने के इच्छुक हैं, तो जाएं audiostory.ai - ElevenLabs का एक साइड-प्रोजेक्ट जो हमारी लंबी-फॉर्मेट स्पीच जनरेशन क्षमताओं को प्रदर्शित करने के लिए है जहां हम अपने सिंथेटिक आवाज़ों का उपयोग करके अतीत के समाचार लेख और किताबें पढ़ते हैं। पहला एपिसोड 1899 का एक लेख है The New York Times से रेडियो के आविष्कार पर - इसे सुनें यहां। या, यदि आपने पहले से नहीं किया है, तो आप इस पृष्ठ के शीर्ष पर जा सकते हैं और इस प्रविष्टि को जोर से पढ़ा सुन सकते हैं।
ElevenLabs UI is a component library to help you build multimodal agents faster.
A CCaaS platform now powered by native conversational AI
ElevenLabs द्वारा संचालित एजेंट्स