
Announcing an Employee Tender Offer at $6.6B valuation
Rewarding the team as we cross $200M in ARR and see exponential growth in enterprise adoption
प्रोफेशनल वॉइस क्लोनिंग विभिन्न ऑडियो उपयोग मामलों में सुविधा और स्थिरता का अवसर प्रदान करता है
हम अपने प्रोफेशनल वॉइस क्लोनिंग (PVC) मॉडल को व्यापक जनता के लिए जारी करने पर गर्व महसूस कर रहे हैं। पहले यह केवल हमारे एंटरप्राइज क्लाइंट्स के लिए उपलब्ध था, अब हम इसे सभी के लिए खोल रहे हैं, जिससे आप अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं; जो मूल से लगभग अप्रभेद्य है।
हमने मार्च में यूज़र्स को उनकी आवाज़ डेटा अपलोड करने की सुविधा दी थी और वादा किया था कि जुलाई में पहले आओ, पहले पाओ के आधार पर आवाज़ें जारी करेंगे - वे अब यहाँ हैं।
PVC क्रिएटर प्लान या उससे ऊपर के सभी के लिए मुफ़्त है। इसके अलावा, आपकी PVC आवाज़ Eleven Multilingual v1 द्वारा समर्थित सभी भाषाओं में स्वतः बोल सकती है!
PVC का उपयोग करने के लिए, बस VoiceLab पर जाएं, 'नई आवाज़ जोड़ें' पर क्लिक करें, और प्रोफेशनल वॉइस क्लोनिंग चुनें। हमारे इंस्टेंट क्लोनिंग फीचर के विपरीत, PVC में आवाज़ सैंपल के बड़े डेटासेट पर एक समर्पित मॉडल का प्रशिक्षण शामिल होता है - कम से कम 30 मिनट, 3 घंटे आदर्श होते हैं.
उच्चतम गुणवत्ता वाले आउटपुट को सुनिश्चित करने के लिए, कुछ बातें ध्यान में रखें जब आप अपने सैंपल्स को फाइन-ट्यूनिंग के लिए तैयार कर रहे हों।
पहले, सुनिश्चित करें कि प्रशिक्षण डेटा में एकल स्पीकर की साफ़ ऑडियो फाइलें हों, जिनमें कोई बैकग्राउंड शोर, संगीत या अन्य प्रभाव न हों. कोई भी गैर-वाक ध्वनियाँ मॉडल को भ्रमित कर सकती हैं और आउटपुट में आ सकती हैं। यदि आप अलग-अलग सत्रों में रिकॉर्ड की गई कई ऑडियो फाइलें अपलोड करते हैं, तो सुनिश्चित करें कि रिकॉर्डिंग की स्थिति को यथासंभव मिलाएं - माइक्रोफोन से दूरी या रिवर्ब में ध्यान देने योग्य अंतर भी आउटपुट को प्रभावित करेगा।
आपकी बोलने की शैली के लिए भी यही सच है - आपकी डिलीवरी की शैली सभी अपलोड किए गए सैंपल्स में समान होनी चाहिए. उदाहरण के लिए, यदि आप अपनी आवाज़ का उपयोग ऑडियोबुक रिकॉर्ड करने के लिए करने की योजना बना रहे हैं, तो प्रशिक्षण डेटा में ऑडियोबुक डिलीवरी शैली में आपकी रिकॉर्डिंग शामिल होनी चाहिए।
PVC हमारे सभी मॉडलों के साथ इंटीग्रेटेड आता है, जिसमें Eleven Multilingual v1 भी शामिल है। यदि आप उन भाषाओं में से किसी को बोलते हैं जो यह समर्थन करता है, तो आप अपनी आवाज़ की एक परफेक्ट प्रतिकृति बना सकते हैं और इसे अन्य सभी भाषाओं में भी बोल सकते हैं!
हम मॉडल को कम से कम महीने में एक बार चलाते हैं, अनुरोधों की संख्या के आधार पर, और तिमाही के अंत तक और तेज़ी की उम्मीद है।
हमारी तकनीक के सुरक्षित उपयोग और सख्त यूज़र प्राइवेसी और नैतिक दिशानिर्देशों को बनाए रखने के लिए, हमने मजबूत सुरक्षा उपायों को इंटीग्रेट किया है ताकि आप केवल अपनी आवाज़ को ही क्लोन कर सकें.
एक बार जब आप प्रशिक्षण के लिए अपना भाषण डेटा अपलोड करते हैं, तो एक सत्यापन चरण होता है। इसमें, आपको एक टेक्स्ट कैप्चा प्रॉम्प्ट दिया जाता है। फिर आपको इसे 10 सेकंड के भीतर जोर से पढ़ने के लिए कहा जाता है। हम इस रिकॉर्डिंग से वॉइस प्रोफाइल की तुलना आपके अपलोड किए गए डेटा में मौजूद आवाज़ से करके आपके अनुरोध को मान्य करते हैं।
यदि मेल होता है, तो आपका अनुरोध फाइन-ट्यूनिंग के लिए भेजा जाता है। यदि नहीं, तो आपके पास 4 सत्यापन प्रयास शेष हैं। यदि वे सभी अमान्य हैं, तो आपको अपनी आवाज़ को मैन्युअल रूप से सत्यापित करने के लिए हमारे सहायता केंद्र के माध्यम से संपर्क करना होगा।
जब तक आप इसे साझा करने का निर्णय नहीं लेते, आपकी आवाज़ केवल आपकी है और केवल आपके लिए उपलब्ध है.
प्रोफेशनल वॉइस क्लोनिंग साधारण सुविधा से परे है और आपके व्यक्तिगत और व्यावसायिक प्रोजेक्ट्स के लिए कई फायदे प्रदान करता है। यहाँ कुछ उदाहरण हैं:
प्रोफेशनल वॉइस क्लोनिंग आपको डिजिटल रूप से खुद को प्रस्तुत करने में अधिक नियंत्रण देता है। यह केवल आवाज़ की प्रतिकृति नहीं है - यह विभिन्न ऑडियो उपयोग मामलों में सुविधा और सुसंगति का अवसर है!
Rewarding the team as we cross $200M in ARR and see exponential growth in enterprise adoption
A major US eyewear retailer and its media agency used Audiostack and ElevenLabs voices to produce hyperlocalized ads to drive store visits
ElevenLabs द्वारा संचालित एजेंट्स