
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
प्रोफेशनल वॉइस क्लोनिंग विभिन्न ऑडियो उपयोग मामलों में सुविधा और स्थिरता का अवसर प्रदान करता है
हम अपने प्रोफेशनल वॉइस क्लोनिंग (PVC) मॉडल को व्यापक जनता के लिए जारी करने पर गर्व महसूस कर रहे हैं। पहले यह केवल हमारे एंटरप्राइज क्लाइंट्स के लिए उपलब्ध था, अब हम इसे सभी के लिए खोल रहे हैं, जिससे आप अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं; जो मूल से लगभग अप्रभेद्य है।
हमने मार्च में यूज़र्स को उनकी आवाज़ डेटा अपलोड करने की सुविधा दी थी और वादा किया था कि जुलाई में पहले आओ, पहले पाओ के आधार पर आवाज़ें जारी करेंगे - वे अब यहाँ हैं।
PVC क्रिएटर प्लान या उससे ऊपर के सभी के लिए मुफ़्त है। इसके अलावा, आपकी PVC आवाज़ Eleven Multilingual v1 द्वारा समर्थित सभी भाषाओं में स्वतः बोल सकती है!
PVC का उपयोग करने के लिए, बस VoiceLab पर जाएं, 'नई आवाज़ जोड़ें' पर क्लिक करें, और प्रोफेशनल वॉइस क्लोनिंग चुनें। हमारे इंस्टेंट क्लोनिंग फीचर के विपरीत, PVC में आवाज़ सैंपल के बड़े डेटासेट पर एक समर्पित मॉडल का प्रशिक्षण शामिल होता है - कम से कम 30 मिनट, 3 घंटे आदर्श होते हैं.
उच्चतम गुणवत्ता वाले आउटपुट को सुनिश्चित करने के लिए, कुछ बातें ध्यान में रखें जब आप अपने सैंपल्स को फाइन-ट्यूनिंग के लिए तैयार कर रहे हों।
पहले, सुनिश्चित करें कि प्रशिक्षण डेटा में एकल स्पीकर की साफ़ ऑडियो फाइलें हों, जिनमें कोई बैकग्राउंड शोर, संगीत या अन्य प्रभाव न हों. कोई भी गैर-वाक ध्वनियाँ मॉडल को भ्रमित कर सकती हैं और आउटपुट में आ सकती हैं। यदि आप अलग-अलग सत्रों में रिकॉर्ड की गई कई ऑडियो फाइलें अपलोड करते हैं, तो सुनिश्चित करें कि रिकॉर्डिंग की स्थिति को यथासंभव मिलाएं - माइक्रोफोन से दूरी या रिवर्ब में ध्यान देने योग्य अंतर भी आउटपुट को प्रभावित करेगा।
आपकी बोलने की शैली के लिए भी यही सच है - आपकी डिलीवरी की शैली सभी अपलोड किए गए सैंपल्स में समान होनी चाहिए. उदाहरण के लिए, यदि आप अपनी आवाज़ का उपयोग ऑडियोबुक रिकॉर्ड करने के लिए करने की योजना बना रहे हैं, तो प्रशिक्षण डेटा में ऑडियोबुक डिलीवरी शैली में आपकी रिकॉर्डिंग शामिल होनी चाहिए।
PVC हमारे सभी मॉडलों के साथ इंटीग्रेटेड आता है, जिसमें Eleven Multilingual v1 भी शामिल है। यदि आप उन भाषाओं में से किसी को बोलते हैं जो यह समर्थन करता है, तो आप अपनी आवाज़ की एक परफेक्ट प्रतिकृति बना सकते हैं और इसे अन्य सभी भाषाओं में भी बोल सकते हैं!
हम मॉडल को कम से कम महीने में एक बार चलाते हैं, अनुरोधों की संख्या के आधार पर, और तिमाही के अंत तक और तेज़ी की उम्मीद है।
हमारी तकनीक के सुरक्षित उपयोग और सख्त यूज़र प्राइवेसी और नैतिक दिशानिर्देशों को बनाए रखने के लिए, हमने मजबूत सुरक्षा उपायों को इंटीग्रेट किया है ताकि आप केवल अपनी आवाज़ को ही क्लोन कर सकें.
एक बार जब आप प्रशिक्षण के लिए अपना भाषण डेटा अपलोड करते हैं, तो एक सत्यापन चरण होता है। इसमें, आपको एक टेक्स्ट कैप्चा प्रॉम्प्ट दिया जाता है। फिर आपको इसे 10 सेकंड के भीतर जोर से पढ़ने के लिए कहा जाता है। हम इस रिकॉर्डिंग से वॉइस प्रोफाइल की तुलना आपके अपलोड किए गए डेटा में मौजूद आवाज़ से करके आपके अनुरोध को मान्य करते हैं।
यदि मेल होता है, तो आपका अनुरोध फाइन-ट्यूनिंग के लिए भेजा जाता है। यदि नहीं, तो आपके पास 4 सत्यापन प्रयास शेष हैं। यदि वे सभी अमान्य हैं, तो आपको अपनी आवाज़ को मैन्युअल रूप से सत्यापित करने के लिए हमारे सहायता केंद्र के माध्यम से संपर्क करना होगा।
जब तक आप इसे साझा करने का निर्णय नहीं लेते, आपकी आवाज़ केवल आपकी है और केवल आपके लिए उपलब्ध है.
प्रोफेशनल वॉइस क्लोनिंग साधारण सुविधा से परे है और आपके व्यक्तिगत और व्यावसायिक प्रोजेक्ट्स के लिए कई फायदे प्रदान करता है। यहाँ कुछ उदाहरण हैं:
प्रोफेशनल वॉइस क्लोनिंग आपको डिजिटल रूप से खुद को प्रस्तुत करने में अधिक नियंत्रण देता है। यह केवल आवाज़ की प्रतिकृति नहीं है - यह विभिन्न ऑडियो उपयोग मामलों में सुविधा और सुसंगति का अवसर है!
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
ElevenLabs द्वारा संचालित एजेंट्स