
अब ElevenLabs एजेंट्स WhatsApp पर भी उपलब्ध
- श्रेणी
- प्रोडक्ट
- तारीख
यह वॉइस ट्रांसलेशन टूल कुछ ही मिनटों में बोले गए कंटेंट को दूसरी भाषा में बदल सकता है, जबकि मूल वक्ता की आवाज़ को बनाए रखता है।
10 अक्टूबर, वैश्विक - ElevenLabs, वॉइस AI टेक्नोलॉजी में वैश्विक नेता, आज एक क्रांतिकारी वॉइस ट्रांसलेशन फीचर को अपने प्लेटफ़ॉर्म में जोड़ने की घोषणा करता है। ElevenLabs की स्थापना के समय से ही सामग्री की भाषाई बाधाओं को समाप्त करने के मूल मिशन से उत्पन्न, और कंपनी के अब तक के शोध का परिणाम, AI डबिंग टूल यूज़र्स को किसी भी स्पीच को दूसरी भाषा में स्वचालित रूप से अनुवाद करने में सक्षम बनाता है, जबकि मूल वक्ता की आवाज़ को बनाए रखता है - ऑडियो और वीडियो सामग्री को डब करने का एक नया, उच्च गुणवत्ता और प्रभावी तरीका।
ElevenLabs के सीईओ और सह-संस्थापक, माटी स्टानिस्ज़ेव्स्की, कहते हैं:
“AI डबिंग का रिलीज़ हमारी सामग्री की भाषाई बाधाओं को समाप्त करने की दिशा में अब तक का सबसे बड़ा कदम है। यह दर्शकों को किसी भी भाषा में सामग्री का आनंद लेने में मदद करेगा। और इसका मतलब है कि कंटेंट क्रिएटर्स आसानी से और प्रामाणिक रूप से दुनिया भर में एक बड़े दर्शक वर्ग तक पहुंच सकते हैं। इन भाषाई बाधाओं का खुद अनुभव करने के बाद, मेरे सह-संस्थापक पियोटर और मैं AI डबिंग को जीवन में लाने के लिए बहुत उत्साहित हैं।”
स्ट्रीमिंग, गेमिंग और फिल्मों जैसे माध्यमों में सामग्री की पहुंच में एक नए युग का संकेत देते हुए, नया टूल पारंपरिक अनुवाद और कैप्शनिंग से आगे बढ़ता है, अनुवादित होने पर वक्ता की पहचान और मूल भाषण पैटर्न को बनाए रखता है। इसका मतलब है कि वही अभिनेता की आवाज़ 20 से अधिक विभिन्न भाषाओं में दर्शकों द्वारा सुनी जा सकती है, मूल रिकॉर्डिंग की विशेषताओं और बारीकियों के साथ।
AI डबिंग कंपनी के बहुभाषी भाषण संश्लेषण, वॉइस क्लोनिंग, टेक्स्ट और ऑडियो प्रोसेसिंग पर शोध को एक ही टूल में जोड़ता है; अनुवादित सामग्री की प्रामाणिकता को बढ़ाता है और इसे व्यापक दर्शकों के लिए अधिक सुलभ बनाता है, जबकि मूल प्रस्तुति का सार बनाए रखता है। AI डबिंग फीचर 20 से अधिक भाषाओं में वॉइस ट्रांसलेशन का समर्थन करता है, जो वर्तमान में Eleven Multilingual v2 मॉडल द्वारा समर्थित हैं, जिनमें हिंदी, पुर्तगाली, स्पेनिश, जापानी, यूक्रेनी, पोलिश या अरबी शामिल हैं।
यह कदम ElevenLabs के ऑडियो AI क्षेत्र में शोध को और बढ़ाता है; मूल ऑडियो से भावनाओं और स्वर को डब किए गए ऑडियो में बदलने में सक्षम बनाता है। कंपनी ने विभिन्न वक्ताओं की आवाज़ों का पता लगाने और बैकग्राउंड शोर को हटाने के अपने तरीके भी विकसित किए हैं, संगीत और शोर को संवाद से अलग करते हुए। इसका मतलब है कि टूल कई वक्ताओं वाले ऑडियो या वीडियो को प्रभावी ढंग से संभाल सकता है, यह सुनिश्चित करते हुए कि प्रत्येक आवाज़ विभिन्न भाषाओं में अलग और पहचानने योग्य बनी रहे।
डबिंग प्रक्रिया को स्वचालित करके और उच्च गुणवत्ता वाले आउटपुट को सुनिश्चित करके, ElevenLabs क्रिएटर्स, शिक्षकों और मीडिया कंपनियों के लिए बहुभाषी सामग्री का निर्माण सरल बनाता है। दुनिया की केवल 6% आबादी ही मूल अंग्रेजी बोलने वाली है और 75% कोई अंग्रेजी नहीं बोलते। इस रिलीज़ का मतलब है कि अब हर वीडियो को वैश्विक दर्शकों के लिए उपलब्ध कराया जा सकता है, वह भी तेज़ी से और कम लागत पर।
यह घोषणा हाल ही में जारी स्टूडियो - ElevenLabs का उन्नत वर्कफ़्लो है जो लंबे फॉर्मेट के ऑडियो को उत्पन्न और संपादित करने के लिए है, जिसमें स्पीकर असाइनमेंट, पॉज़ इंसर्शन और सेगमेंट पुनर्जनन जैसी विभिन्न संपादन सुविधाओं का समर्थन करता है।
इस जोड़ के साथ, ElevenLabs अपनी भाषा बाधाओं को तोड़ने और किसी भी भाषा और आवाज़ में सामग्री को सार्वभौमिक रूप से सुलभ बनाने के मिशन को जारी रखता है।



