
Eleven Music, now available in the API
Eleven Music is the first API for developers trained on licensed data and cleared for broad commercial use.
प्रोफेशनल वॉइस क्लोनिंग विभिन्न ऑडियो उपयोग मामलों में सुविधा और स्थिरता का अवसर प्रदान करता है
हम अपने प्रोफेशनल वॉइस क्लोनिंग (PVC) मॉडल को व्यापक जनता के लिए जारी करने पर गर्व महसूस कर रहे हैं। पहले यह केवल हमारे एंटरप्राइज क्लाइंट्स के लिए उपलब्ध था, अब हम इसे सभी के लिए खोल रहे हैं, जिससे आप अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं; जो मूल से लगभग अप्रभेद्य है।
हमने मार्च में यूज़र्स को उनकी आवाज़ डेटा अपलोड करने की सुविधा दी थी और वादा किया था कि जुलाई में पहले आओ, पहले पाओ के आधार पर आवाज़ें जारी करेंगे - वे अब यहाँ हैं।
PVC क्रिएटर प्लान या उससे ऊपर के सभी के लिए मुफ़्त है। इसके अलावा, आपकी PVC आवाज़ Eleven Multilingual v1 द्वारा समर्थित सभी भाषाओं में स्वतः बोल सकती है!
PVC का उपयोग करने के लिए, बस VoiceLab पर जाएं, 'नई आवाज़ जोड़ें' पर क्लिक करें, और प्रोफेशनल वॉइस क्लोनिंग चुनें। हमारे इंस्टेंट क्लोनिंग फीचर के विपरीत, PVC में आवाज़ सैंपल के बड़े डेटासेट पर एक समर्पित मॉडल का प्रशिक्षण शामिल होता है - कम से कम 30 मिनट, 3 घंटे आदर्श होते हैं.
उच्चतम गुणवत्ता वाले आउटपुट को सुनिश्चित करने के लिए, कुछ बातें ध्यान में रखें जब आप अपने सैंपल्स को फाइन-ट्यूनिंग के लिए तैयार कर रहे हों।
पहले, सुनिश्चित करें कि प्रशिक्षण डेटा में एकल स्पीकर की साफ़ ऑडियो फाइलें हों, जिनमें कोई बैकग्राउंड शोर, संगीत या अन्य प्रभाव न हों. कोई भी गैर-वाक ध्वनियाँ मॉडल को भ्रमित कर सकती हैं और आउटपुट में आ सकती हैं। यदि आप अलग-अलग सत्रों में रिकॉर्ड की गई कई ऑडियो फाइलें अपलोड करते हैं, तो सुनिश्चित करें कि रिकॉर्डिंग की स्थिति को यथासंभव मिलाएं - माइक्रोफोन से दूरी या रिवर्ब में ध्यान देने योग्य अंतर भी आउटपुट को प्रभावित करेगा।
आपकी बोलने की शैली के लिए भी यही सच है - आपकी डिलीवरी की शैली सभी अपलोड किए गए सैंपल्स में समान होनी चाहिए. उदाहरण के लिए, यदि आप अपनी आवाज़ का उपयोग ऑडियोबुक रिकॉर्ड करने के लिए करने की योजना बना रहे हैं, तो प्रशिक्षण डेटा में ऑडियोबुक डिलीवरी शैली में आपकी रिकॉर्डिंग शामिल होनी चाहिए।
PVC हमारे सभी मॉडलों के साथ इंटीग्रेटेड आता है, जिसमें Eleven Multilingual v1 भी शामिल है। यदि आप उन भाषाओं में से किसी को बोलते हैं जो यह समर्थन करता है, तो आप अपनी आवाज़ की एक परफेक्ट प्रतिकृति बना सकते हैं और इसे अन्य सभी भाषाओं में भी बोल सकते हैं!
हम मॉडल को कम से कम महीने में एक बार चलाते हैं, अनुरोधों की संख्या के आधार पर, और तिमाही के अंत तक और तेज़ी की उम्मीद है।
हमारी तकनीक के सुरक्षित उपयोग और सख्त यूज़र प्राइवेसी और नैतिक दिशानिर्देशों को बनाए रखने के लिए, हमने मजबूत सुरक्षा उपायों को इंटीग्रेट किया है ताकि आप केवल अपनी आवाज़ को ही क्लोन कर सकें.
एक बार जब आप प्रशिक्षण के लिए अपना भाषण डेटा अपलोड करते हैं, तो एक सत्यापन चरण होता है। इसमें, आपको एक टेक्स्ट कैप्चा प्रॉम्प्ट दिया जाता है। फिर आपको इसे 10 सेकंड के भीतर जोर से पढ़ने के लिए कहा जाता है। हम इस रिकॉर्डिंग से वॉइस प्रोफाइल की तुलना आपके अपलोड किए गए डेटा में मौजूद आवाज़ से करके आपके अनुरोध को मान्य करते हैं।
यदि मेल होता है, तो आपका अनुरोध फाइन-ट्यूनिंग के लिए भेजा जाता है। यदि नहीं, तो आपके पास 4 सत्यापन प्रयास शेष हैं। यदि वे सभी अमान्य हैं, तो आपको अपनी आवाज़ को मैन्युअल रूप से सत्यापित करने के लिए हमारे सहायता केंद्र के माध्यम से संपर्क करना होगा।
जब तक आप इसे साझा करने का निर्णय नहीं लेते, आपकी आवाज़ केवल आपकी है और केवल आपके लिए उपलब्ध है.
प्रोफेशनल वॉइस क्लोनिंग साधारण सुविधा से परे है और आपके व्यक्तिगत और व्यावसायिक प्रोजेक्ट्स के लिए कई फायदे प्रदान करता है। यहाँ कुछ उदाहरण हैं:
प्रोफेशनल वॉइस क्लोनिंग आपको डिजिटल रूप से खुद को प्रस्तुत करने में अधिक नियंत्रण देता है। यह केवल आवाज़ की प्रतिकृति नहीं है - यह विभिन्न ऑडियो उपयोग मामलों में सुविधा और सुसंगति का अवसर है!
Eleven Music is the first API for developers trained on licensed data and cleared for broad commercial use.
Delivering a complete customer engagement solution by adding voice support
ElevenLabs द्वारा संचालित कन्वर्सेशनल AI