
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Eleven v3 ऑडियो टैग्स के साथ वाक्य के बीच में ही आसानी से उच्चारण बदलें। अमेरिकी, ब्रिटिश, फ्रेंच और अन्य के लिए गतिशील, सांस्कृतिक रूप से समृद्ध AI स्पीच का अनुकरण करें।
Eleven के साथ v3 ऑडियो टैग्स, उच्चारण बदलना ब्रैकेट में संकेत लिखने जितना आसान है। आप अमेरिकी, ब्रिटिश, फ्रेंच, ऑस्ट्रेलियाई — या किसी भी समर्थित उच्चारण के बीच वाक्य, स्क्रिप्ट या चरित्र के बीच में बदल सकते हैं।
यह उन क्रिएटर्स के लिए नए अवसर खोलता है जो गतिशील, वैश्विक या अभिव्यक्तिपूर्ण वॉइस परफॉर्मेंस चाहते हैं — बिना अलग वॉइस मॉडल या मैन्युअल रीटेक की आवश्यकता के।
उच्चारण अनुकरण एक आवाज़ की उच्चारण और लय को विभिन्न क्षेत्रों या बोलियों से मेल करने की क्षमता है। यह अनुवाद नहीं है — शब्द वही रहते हैं — लेकिन उन्हें बोलने का तरीका बदल जाता है।
[French accent], [Australian accent], या [Southern US accent] जैसे टैग्स के साथ, आप मॉडल को क्षेत्रीय रूप से बोलने के लिए निर्देशित कर सकते हैं — और जब ज़रूरत हो तो आसानी से बदल सकते हैं।
उदाहरण: [American accent] क्या आप पुराने मॉडल में मेरा उच्चारण बदल सकते थे? [dismissive] नहीं लगता। [cheeky][Australian accent] लेकिन अब आप कर सकते हैं — इसे देखें, दोस्त! [French accent] मेरा प्यार... एक लाल, लाल गुलाब की तरह है।
यह नकल नहीं है — यह संदर्भ में मूल डिलीवरी है। जिस स्रोत आवाज़ का आप उपयोग करते हैं, वह ऑडियो टैग द्वारा परिभाषित उच्चारण की गुणवत्ता को प्रभावित करेगी।
उच्चारण अनुकरण आपको रचनात्मक और सांस्कृतिक रेंज देता है। आप सामग्री को स्थानीयकृत कर सकते हैं, चरित्र की पहचान परिभाषित कर सकते हैं, या संवाद को भौगोलिक रूप से आधारित महसूस करा सकते हैं — वह भी एक ही मॉडल से।
उदाहरण के लिए:
उच्चारण संकेत आपको सीधे इन अनुभवों को स्क्रिप्ट करने देते हैं, बिना किसी मॉडल स्विचिंग के।
ये टैग क्षेत्रीय पहचान और टोन को परिभाषित करने में मदद करते हैं:
इन टैग्स का उपयोग भावनात्मक या डिलीवरी संकेतों के साथ किया जा सकता है ताकि परतदार प्रदर्शन बनाया जा सके: [British accent][exasperated] आप मुझे बता रहे हैं *यह* समाधान है? शानदार।[Southern US accent][calmly] चिंता मत करो। हमारे पास समय है।
Accent switching is especially powerful when combined with Character Performance and Multi-Character Dialogue.
उदाहरण के लिए:
प्रत्येक वक्ता अलग महसूस होता है — भले ही हर पंक्ति एक ही वॉइस मॉडल से दी गई हो।
Eleven v3 के साथ, उच्चारण एक डिज़ाइन तत्व बन जाता है। यह आपके चरित्र की व्यक्तित्व, आपकी कहानी की सेटिंग, या आपके प्रोडक्ट के टोन का हिस्सा है।
और ऑडियो टैग्स के साथ, आप उस पहचान को आदेश पर बदल सकते हैं — विश्वसनीयता और अभिव्यक्तिपूर्ण नियंत्रण के साथ।
प्रोफेशनल वॉइस क्लोन्स (PVCs) वर्तमान में Eleven v3 के लिए पूरी तरह से अनुकूलित नहीं हैं, जिसके परिणामस्वरूप पहले के मॉडलों की तुलना में क्लोन गुणवत्ता कम हो सकती है। इस शोध पूर्वावलोकन चरण के दौरान, यदि आपको v3 फीचर्स का उपयोग करना है, तो आपके प्रोजेक्ट के लिए एक इंस्टेंट वॉइस क्लोन (IVC) या डिज़ाइन की गई आवाज़ ढूंढना सबसे अच्छा होगा। PVC का v3 के लिए अनुकूलन निकट भविष्य में आ रहा है।
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
ElevenLabs द्वारा संचालित एजेंट्स