
Fieldy.ai builds a wearable note taker powered by ElevenLabs
Fieldy.ai is using Scribe to power its new wearable note taker and increase retention by 50%
प्रोफेशनल वॉइस क्लोनिंग विभिन्न ऑडियो उपयोग मामलों में सुविधा और स्थिरता का अवसर प्रदान करता है
हम अपने प्रोफेशनल वॉइस क्लोनिंग (PVC) मॉडल को व्यापक जनता के लिए जारी करने पर गर्व महसूस कर रहे हैं। पहले यह केवल हमारे एंटरप्राइज क्लाइंट्स के लिए उपलब्ध था, अब हम इसे सभी के लिए खोल रहे हैं, जिससे आप अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं; जो मूल से लगभग अप्रभेद्य है।
हमने मार्च में यूज़र्स को उनकी आवाज़ डेटा अपलोड करने की सुविधा दी थी और वादा किया था कि जुलाई में पहले आओ, पहले पाओ के आधार पर आवाज़ें जारी करेंगे - वे अब यहाँ हैं।
PVC क्रिएटर प्लान या उससे ऊपर के सभी के लिए मुफ़्त है। इसके अलावा, आपकी PVC आवाज़ Eleven Multilingual v1 द्वारा समर्थित सभी भाषाओं में स्वतः बोल सकती है!
PVC का उपयोग करने के लिए, बस VoiceLab पर जाएं, 'नई आवाज़ जोड़ें' पर क्लिक करें, और प्रोफेशनल वॉइस क्लोनिंग चुनें। हमारे इंस्टेंट क्लोनिंग फीचर के विपरीत, PVC में आवाज़ सैंपल के बड़े डेटासेट पर एक समर्पित मॉडल का प्रशिक्षण शामिल होता है - कम से कम 30 मिनट, 3 घंटे आदर्श होते हैं.
उच्चतम गुणवत्ता वाले आउटपुट को सुनिश्चित करने के लिए, कुछ बातें ध्यान में रखें जब आप अपने सैंपल्स को फाइन-ट्यूनिंग के लिए तैयार कर रहे हों।
पहले, सुनिश्चित करें कि प्रशिक्षण डेटा में एकल स्पीकर की साफ़ ऑडियो फाइलें हों, जिनमें कोई बैकग्राउंड शोर, संगीत या अन्य प्रभाव न हों. कोई भी गैर-वाक ध्वनियाँ मॉडल को भ्रमित कर सकती हैं और आउटपुट में आ सकती हैं। यदि आप अलग-अलग सत्रों में रिकॉर्ड की गई कई ऑडियो फाइलें अपलोड करते हैं, तो सुनिश्चित करें कि रिकॉर्डिंग की स्थिति को यथासंभव मिलाएं - माइक्रोफोन से दूरी या रिवर्ब में ध्यान देने योग्य अंतर भी आउटपुट को प्रभावित करेगा।
आपकी बोलने की शैली के लिए भी यही सच है - आपकी डिलीवरी की शैली सभी अपलोड किए गए सैंपल्स में समान होनी चाहिए. उदाहरण के लिए, यदि आप अपनी आवाज़ का उपयोग ऑडियोबुक रिकॉर्ड करने के लिए करने की योजना बना रहे हैं, तो प्रशिक्षण डेटा में ऑडियोबुक डिलीवरी शैली में आपकी रिकॉर्डिंग शामिल होनी चाहिए।
PVC हमारे सभी मॉडलों के साथ इंटीग्रेटेड आता है, जिसमें Eleven Multilingual v1 भी शामिल है। यदि आप उन भाषाओं में से किसी को बोलते हैं जो यह समर्थन करता है, तो आप अपनी आवाज़ की एक परफेक्ट प्रतिकृति बना सकते हैं और इसे अन्य सभी भाषाओं में भी बोल सकते हैं!
हम मॉडल को कम से कम महीने में एक बार चलाते हैं, अनुरोधों की संख्या के आधार पर, और तिमाही के अंत तक और तेज़ी की उम्मीद है।
हमारी तकनीक के सुरक्षित उपयोग और सख्त यूज़र प्राइवेसी और नैतिक दिशानिर्देशों को बनाए रखने के लिए, हमने मजबूत सुरक्षा उपायों को इंटीग्रेट किया है ताकि आप केवल अपनी आवाज़ को ही क्लोन कर सकें.
एक बार जब आप प्रशिक्षण के लिए अपना भाषण डेटा अपलोड करते हैं, तो एक सत्यापन चरण होता है। इसमें, आपको एक टेक्स्ट कैप्चा प्रॉम्प्ट दिया जाता है। फिर आपको इसे 10 सेकंड के भीतर जोर से पढ़ने के लिए कहा जाता है। हम इस रिकॉर्डिंग से वॉइस प्रोफाइल की तुलना आपके अपलोड किए गए डेटा में मौजूद आवाज़ से करके आपके अनुरोध को मान्य करते हैं।
यदि मेल होता है, तो आपका अनुरोध फाइन-ट्यूनिंग के लिए भेजा जाता है। यदि नहीं, तो आपके पास 4 सत्यापन प्रयास शेष हैं। यदि वे सभी अमान्य हैं, तो आपको अपनी आवाज़ को मैन्युअल रूप से सत्यापित करने के लिए हमारे सहायता केंद्र के माध्यम से संपर्क करना होगा।
जब तक आप इसे साझा करने का निर्णय नहीं लेते, आपकी आवाज़ केवल आपकी है और केवल आपके लिए उपलब्ध है.
प्रोफेशनल वॉइस क्लोनिंग साधारण सुविधा से परे है और आपके व्यक्तिगत और व्यावसायिक प्रोजेक्ट्स के लिए कई फायदे प्रदान करता है। यहाँ कुछ उदाहरण हैं:
प्रोफेशनल वॉइस क्लोनिंग आपको डिजिटल रूप से खुद को प्रस्तुत करने में अधिक नियंत्रण देता है। यह केवल आवाज़ की प्रतिकृति नहीं है - यह विभिन्न ऑडियो उपयोग मामलों में सुविधा और सुसंगति का अवसर है!
Fieldy.ai is using Scribe to power its new wearable note taker and increase retention by 50%
ElevenLabs Conversational AI now supports WebRTC for improved conversation quality
ElevenLabs द्वारा संचालित कन्वर्सेशनल AI