मैं एक कस्टम AI आवाज़ कैसे बना सकता हूँ?

वॉइसलैब पर जाएं, एक नई आवाज़ जोड़ें, वॉइस डिज़ाइन चुनें, उम्र, लिंग और उच्चारण जैसे पैरामीटर समायोजित करें, और अंत में अपनी आवाज़ उत्पन्न और साझा करें।

आधुनिक प्रकाशन में वॉइस जनरेटर की भूमिका

1 सित॰ 2023 • 9 मिनट पढ़ने का समय

वॉइस जनरेटर तकनीक उन्नत श्रवण अनुभवों का मार्ग प्रशस्त करती है

इस पेज पर

परिचय
बुलेट सारांश
टेक्स्ट टू स्पीच (TTS) तकनीक और AI वॉइस जनरेशन का परिचय
- अंतर को समझना: टेक्स्ट टू स्पीच बनाम वॉइस जनरेटर
वॉइस डिज़ाइन के साथ सही आवाज़ बनाना
- वॉइस लाइब्रेरी: ElevenLabs के साथ नई कथा आयामों का अन्वेषण करें
बहुभाषी कहानी कहने का अनावरण
अपनी प्रामाणिक आवाज़ के साथ सुनाएं: प्रोफेशनल वॉइस क्लोनिंग
- विविध कहानी कहने के लिए वॉइस क्लोनिंग का लाभ उठाना
- प्रक्रिया: अपनी आवाज़ को क्लोन कैसे करें
स्टूडियो के साथ लंबी सामग्री उत्पन्न करना
- शुरू करना
- निष्कर्ष
FAQ

A smart speaker and a smartphone placed on a light wooden table.

बुलेट सारांश

TTS का परिचय और मशीन लर्निंग प्रगति ने भाषण संश्लेषण को कैसे उन्नत किया है।
लेखकों के लिए वॉइस जनरेटर तकनीक के लाभ।
प्रोफेशनल वॉइस क्लोनिंग के साथ कथा को ऊंचा करना।
ElevenLabs के बहुभाषी मॉडल का परिचय।
ElevenLabs का अभिनव वॉइस डिज़ाइन टूल।
कहानी की कथा को बढ़ाने के लिए नई आवाज़ें बनाना।
लेखकों के लिए AI वॉइस तकनीक के भविष्य पर निष्कर्ष और चिंतन।
लेखकों के लिए AI वॉइस जनरेटर से संबंधित FAQ।

टेक्स्ट टू स्पीच (TTS) तकनीक और AI वॉइस जनरेशन का परिचय

टेक्स्ट टू स्पीच (TTS) तकनीक एक संश्लेषण प्रक्रिया है जो लिखित पाठ को श्रव्य भाषण में परिवर्तित करती है। मशीन लर्निंग में तेजी से वृद्धि के साथ, यह संश्लेषण एक बिंदु पर पहुंच गया है जहां यह मानव-निर्मित भाषण से लगभग अप्रभेद्य है। इस तरह की तकनीकी छलांग उन्नत श्रवण अनुभवों का मार्ग प्रशस्त करती है।

अंतर को समझना: टेक्स्ट टू स्पीच बनाम वॉइस जनरेटर

टेक्स्ट टू स्पीच तकनीक लिखित सामग्री को बोले गए शब्दों में परिवर्तित करती है, जिससे यूज़र्स को टेक्स्ट-आधारित स्रोतों से तुरंत श्रव्य सामग्री उत्पन्न करने में मदद मिलती है। यह ऑडियोबुक बनाने, दृष्टिहीन यूज़र्स की सहायता करने और अधिक में मदद करने के लिए एक प्रभावी उपकरण के रूप में कार्य करता है।

एक AI वॉइस जनरेटर यूज़र्स को खुद आवाज़ें बनाने की अनुमति देता है। इस तकनीक के साथ, यूज़र्स वॉइस डिज़ाइन के माध्यम से पूरी तरह से नई सिंथेटिक आवाज़ें बना सकते हैं या वॉइस क्लोनिंग के साथ अपनी खुद की आवाज़ की नकल कर सकते हैं। ये नई बनाई गई या क्लोन की गई आवाज़ें बाद में टेक्स्ट को स्पीच में बदलने के लिए उपयोग की जा सकती हैं, जो एक व्यक्तिगत और बहुमुखी वोकल अनुभव प्रदान करती हैं।

वॉइस डिज़ाइन के साथ सही आवाज़ बनाना

यदि लेखक अपनी खुद की आवाज़ का उपयोग नहीं करना चाहते हैं, तो ElevenLabs उन्हें एक अनोखी आवाज़ बनाने की रचनात्मक स्वतंत्रता प्रदान करता है। वॉइस डिज़ाइन टूल के माध्यम से, आवाज़ों को उम्र, लिंग और उच्चारण प्राथमिकताओं के आधार पर अनुकूलित किया जा सकता है। इसका मतलब है कि एक सस्पेंस थ्रिलर की आवाज़ रोमांस उपन्यास से पूरी तरह अलग हो सकती है, जिससे श्रोता कहानी के माहौल में और अधिक डूब जाते हैं।

वॉइस लाइब्रेरी: ElevenLabs के साथ नई कथा आयामों का अन्वेषण करें

लेखन और कहानी कहने के लगातार विकसित हो रहे परिदृश्य में, नवाचार के लिए हमेशा एक जगह होती है। ElevenLabs में, हमने अपनी वॉइस लाइब्रेरी प्लेटफ़ॉर्म के माध्यम से वॉइस शेयरिंग की धारणा को परिष्कृत किया है। विशेष रूप से वॉइस प्रेमियों के लिए डिज़ाइन की गई, यह सुविधा प्रोफेशनल वॉइस क्लोनिंग की क्षमता को बढ़ाती है, सहयोग, खोज और पुरस्कार को बढ़ावा देती है।

समुदाय वॉइस शेयरिंग और पुरस्कार:

शेयर करें और चमकें: हमारे प्रोफेशनल वॉइस क्लोनिंग का उपयोग करके अपनी अनोखी आवाज़ बनाने के बाद, आपको इसे हमारे समुदाय के साथ साझा करने का अनोखा अवसर मिलता है। जबकि यह विकल्प पूरी तरह से आपके पास है और डिफ़ॉल्ट रूप से आपकी आवाज़ आपके लिए विशेष रहती है, साझा करना पुरस्कार और पहचान का मार्ग प्रशस्त कर सकता है।
कमाएं जबकि अन्य नवाचार करें: जब साथी लेखक या निर्माता आपकी साझा की गई आवाज़ का उपयोग अपनी कथाओं के लिए करते हैं, तो आपको पुरस्कार मिलते हैं। यह हमारी ओर से आपकी व्यापक वॉइस लाइब्रेरी में योगदान की सराहना करने का तरीका है।
खोजें और सहयोग करें: वॉइस लाइब्रेरी रचनाकारों के लिए अपनी कथाओं के लिए विविध आवाज़ों का स्रोत बनाने का एक केंद्र है। लाइब्रेरी में हर आवाज़ के साथ एक मुफ्त व्यावसायिक उपयोग लाइसेंस होता है, जो लेखकों को उन्हें अपनी कहानियों में सहजता से एकीकृत करने की क्षमता प्रदान करता है। चाहे आप एक रोमांटिक कहानी लिख रहे हों, त्योहारी कथा, या एक डॉक्यूमेंट्री नैरेटर की नकल कर रहे हों, आपकी ज़रूरतों के लिए एक आवाज़ है।

ElevenLabs की वॉइस लाइब्रेरी हमारे अत्याधुनिक वॉइस तकनीक को समुदाय-चालित सहयोग के साथ जोड़ने की दृष्टि का प्रतीक है। वॉइस शेयरिंग में भाग लेकर, आप केवल कथा नवाचार के अग्रभाग के साथ संरेखित नहीं हो रहे हैं, बल्कि एक जीवंत पारिस्थितिकी तंत्र में सक्रिय रूप से भाग ले रहे हैं जो पूरे स्पेक्ट्रम में रचनाकारों को ऊपर उठाता है।

बहुभाषी कहानी कहने का अनावरण

हमारे Eleven Multilingual v2 मॉडल के परिचय के साथ, लेखक अपनी कहानियों को एक ही भाषा में सुनाने तक सीमित नहीं हैं। वही प्रामाणिक आवाज़ 28 विभिन्न भाषाओं में कहानियाँ सुना सकती है, वास्तव में उनकी कथाओं की पहुंच को वैश्विक बना रही है।

अब समर्थित भाषाओं में शामिल हैं: अंग्रेजी, कोरियाई, डच, चीनी, तुर्की, स्वीडिश, इंडोनेशियाई, फिलिपिनो, जापानी, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बुल्गारियाई, मलय, स्लोवाक, क्रोएशियाई, क्लासिक अरबी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इतालवी, हिंदी, पुर्तगाली, और तमिल।

अपनी प्रामाणिक आवाज़ के साथ सुनाएं: प्रोफेशनल वॉइस क्लोनिंग

कल्पना करें कि आप एक आकर्षक उपन्यास पढ़ रहे हैं, और इसे लेखक की वास्तविक आवाज़ में सुनाया जा रहा है। लेखक अब प्रोफेशनल वॉइस क्लोनिंग का लाभ उठा सकते हैं – अपनी रचनाओं को अपनी विशिष्ट आवाज़ में सुनाकर अपने दर्शकों को एक प्रामाणिक श्रवण अनुभव प्रदान कर सकते हैं।

विविध कहानी कहने के लिए वॉइस क्लोनिंग का लाभ उठाना

अक्सर, लेखक अपनी कथाओं को विभिन्न प्रारूपों या भाषाओं में बदलने के लिए आवश्यक प्रयास और समय से सीमित होते हैं। प्रोफेशनल वॉइस क्लोनिंग के साथ, यह बाधा नाटकीय रूप से कम हो जाती है, और कहानी कहने का परिदृश्य एक क्रांतिकारी कदम आगे बढ़ता है। इसके अलावा, प्रोफेशनल वॉइस क्लोनिंग हमारे बहुभाषी मॉडल के साथ पूरी तरह से एकीकृत है, जिसका अर्थ है कि अब कोई भी लेखक अपनी रचना को अपनी आवाज़ में, सभी समर्थित भाषाओं में सुना सकता है।

अपनी सर्वश्रेष्ठ कहानियों का अनुवाद विभिन्न भाषाओं में करने की संभावना पर विचार करें, जबकि अपनी खुद की आवाज़ की प्रामाणिकता को बनाए रखते हुए। जब ये बहुभाषी प्रस्तुतियाँ वैश्विक प्लेटफार्मों पर साझा की जाती हैं, तो वे गैर-अंग्रेजी भाषी पृष्ठभूमि के पाठकों को आकर्षित कर सकती हैं। यह न केवल आपके काम की पहुंच का विस्तार करता है; यह अंतरराष्ट्रीय लेखकों या प्रकाशकों के साथ संभावित सहयोग के द्वार भी खोलता है।

PVC और वॉइस जनरेशन तकनीकों का उपयोग करके, लेखक विभिन्न मल्टीमीडिया सामग्री निर्माण मार्गों में प्रवेश कर सकते हैं, ऑडियोबुक से लेकर एनिमेटेड कथाओं तक – सभी अपनी हस्ताक्षरित आवाज़ में। ऐसी विविधता लेखकों को मीडिया प्लेटफार्मों पर सर्वव्यापी होने की क्षमता को वास्तव में अपनाने की अनुमति देती है, कहानी कहने की दुनिया में एक नए अध्याय की शुरुआत करती है।

00:00 / 00:00

प्रक्रिया: अपनी आवाज़ को क्लोन कैसे करें

जो लोग PVC का उपयोग करना चाहते हैं, उनके लिए ElevenLabs में प्रक्रिया को सटीकता के लिए सुव्यवस्थित किया गया है।

जाएँ वॉइसलैब
नई आवाज़ जोड़ें
प्रोफेशनल वॉइस क्लोनिंग चुनें
वॉइस सैंपल अपलोड करें

अंतिम चरण को सही करना महत्वपूर्ण है। प्रोफेशनल वॉइस क्लोनिंग हमारी इंस्टेंट वॉइस क्लोनिंग सुविधा से भिन्न है, क्योंकि यह वॉइस सैंपल के व्यापक डेटासेट पर एक अद्वितीय मॉडल को प्रशिक्षित करने पर केंद्रित है।

सर्वोत्तम परिणाम प्राप्त करने के लिए, कुछ महत्वपूर्ण बातें ध्यान में रखनी चाहिए:

ऑडियो की गुणवत्ता: प्रशिक्षण डेटा में एकल वक्ता से स्पष्ट ऑडियो फ़ाइलें होनी चाहिए, जिनमें पृष्ठभूमि की गड़बड़ी या प्रभाव न हों।
एकरूपता: लगातार आउटपुट के लिए, रिकॉर्डिंग की स्थिति, रिवर्ब और माइक्रोफोन की दूरी में एकरूपता सुनिश्चित करें।
संगत बोलने की शैली: आपकी आवाज़ की डिलीवरी शैली सभी नमूनों में संगत होनी चाहिए। उदाहरण के लिए, यदि ऑडियोबुक का उत्पादन कर रहे हैं, तो प्रशिक्षण डेटा में ऑडियोबुक-शैली की पढ़ाई होनी चाहिए।

00:00 / 00:00

स्टूडियो के साथ लंबी सामग्री उत्पन्न करना

स्टूडियो हमारी एंड-टू-एंड वर्कफ़्लो है जो मिनटों में ऑडियोबुक बनाने के लिए है। यह आपके ऑडियो निर्माणों पर अभूतपूर्व स्तर का नियंत्रण प्रदान करता है, जिसमें विशिष्ट ऑडियो टुकड़ों को पुनः उत्पन्न करने, विशेष टेक्स्ट अंशों को विभिन्न वक्ताओं को असाइन करने, कई प्रारूप फ़ाइलों को सीधे आयात करने की क्षमता शामिल है।

शुरू करना

नेविगेट करना स्टूडियो आसान और सहज है।

शीर्ष बार मेनू से स्टूडियो चुनें।
नया प्रोजेक्ट बनाएं पर क्लिक करें।
अपने प्रोजेक्ट को प्रारंभ करने का तरीका चुनें।
अपना टेक्स्ट बनाना शुरू करें।
अपने पूरे प्रोजेक्ट को एक बार में रेंडर करने के लिए कन्वर्ट पर क्लिक करें, या विशिष्ट अंशों का परीक्षण करने के लिए प्ले और रीजनरेट का उपयोग करें।

स्टूडियो

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

वीडियो और ऑडियो संपादित करने, वॉइसओवर और संगीत जोड़ने, टेक्स्ट में ट्रांसक्राइब करने और वर्णनात्मक, कैप्शनयुक्त प्रोडक्शंस प्रकाशित करने के लिए आपका पूरा वर्कफ़्लो

निष्कर्ष

जैसे-जैसे डिजिटल कथा परिदृश्य विकसित होता जा रहा है, लेखकों के पास अपने दर्शकों के साथ सार्थक, सुलभ तरीकों से जुड़ने के लिए पहले से कहीं अधिक उपकरण हैं। लेखन के साथ अत्याधुनिक वॉइस जनरेटर तकनीक का संयोजन एक ऐसे भविष्य का वादा करता है जहां कहानियाँ केवल पढ़ी नहीं जातीं; उन्हें सुना, महसूस किया और अनुभव किया जाता है।

अपडेट: जनवरी 2025 से, प्रोजेक्ट्स को अब स्टूडियो कहा जाता है और यह सभी मुफ्त यूज़र्स के लिए उपलब्ध है.

FAQ

एक AI वॉइस जनरेटर एक उन्नत उपकरण है जो यूज़र्स को नई सिंथेटिक आवाज़ें बनाने की अनुमति देता है। इन आवाज़ों का उपयोग विभिन्न अनुप्रयोगों के लिए उच्च-गुणवत्ता, जीवन जैसी भाषण उत्पन्न करने के लिए किया जा सकता है।

हाँ, टेक्स्ट टू स्पीच लिखित सामग्री को बोले गए शब्दों में परिवर्तित करता है, जबकि AI वॉइस जनरेटर आपको सिंथेटिक आवाज़ें बनाने और संशोधित करने की अनुमति देता है जिन्हें बाद में टेक्स्ट को स्पीच में बदलने के लिए उपयोग किया जा सकता है।

हमारे बहुभाषी मॉडल के साथ पूर्ण एकीकरण के लिए धन्यवाद, प्लेटफ़ॉर्म पर सभी आवाज़ें 28 भाषाओं में धाराप्रवाह बोल सकती हैं, प्रत्येक भाषा में अपनी अनूठी विशेषताओं और प्रामाणिकता को बनाए रखते हुए।

हाँ, आप वॉइस डिज़ाइन के साथ उत्पन्न आवाज़ों का उपयोग फिल्म निर्माण, गेम डेवलपमेंट, प्रकाशन और अधिक जैसे विभिन्न उद्योगों में कर सकते हैं, अपनी सामग्री को जीवन जैसी सिंथेटिक आवाज़ों के साथ बढ़ा सकते हैं।

ElevenLabs टीम के लेखों को देखें

Customer stories

Customer stories

Avidio scales personalised outreach with hyper-personalized video

Delivering authentic ad-style videos powered by human-sounding AI voices by ElevenLabs

Agents Platform Stories

Immobiliare.it builds conversational real estate agent in days using ElevenLabs

Italy’s leading property marketplace adds 24/7 voice support with AI

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें

ElevenLabs द्वारा संचालित एजेंट्स