
Eleven v3 Audio Tags: Bringing multi-character dialogue to life
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.
Eleven v3 अल्फा का परिचय
v3 आजमाएंस्वाभाविक बातचीत के लिए टोन, भावना, और गति को नियंत्रित करें। अपने टेक्स्ट टू स्पीच में कैरेक्टर परफॉर्मेंस जोड़ें।
ऑडियो टैग्स ElevenLabs के नए रिसर्च प्रीव्यू टेक्स्ट टू स्पीच मॉडल Eleven v3 (अल्फा) में एक शक्तिशाली टूल हैं। ये तत्व न केवल टोन और गति बल्कि चरित्र और वोकल प्रदर्शन पर सटीक दिशा प्रदान करते हैं।
[पाइरेट वॉइस], [फ्रेंच एक्सेंट], या [व्यंग्यात्मक रूप से] जैसे टैग्स के साथ, आवाज़ सिर्फ वर्णन नहीं बल्कि कहानी कहने का एक साधन बन जाती है। एक मजबूत चरित्र वॉइस क्लोन के साथ, आप न केवल एक ध्वनि बल्कि एक पूरा प्रदर्शन कैप्चर कर सकते हैं।
ये टैग्स वोकल पहचान को मिड-लाइन में बदलने, एक्सेंट्स की नकल करने, या खलनायक, कथाकार, या सहायक पात्र जैसे आर्केटाइप्स में ढलने की अनुमति देते हैं — बिना मूल स्क्रिप्ट बदले या अलग आवाज़ में स्विच किए।
चरित्र प्रदर्शन भूमिका में कदम रखने की क्षमता है। चाहे आप एक रंगीन खलनायक, एक कठोर समुद्री कप्तान, या मेलबर्न के एक स्थानीय दुकानदार की आवाज़ दे रहे हों, नए ऑडियो टैग्स आपको उस व्यक्तित्व के अनुसार डिलीवरी को निर्देशित करने देते हैं जिसे आप व्यक्त करना चाहते हैं।
एक साधारण ब्रैकेटेड वाक्यांश के साथ, आप दृश्य सेट कर सकते हैं: “[पाइरेट वॉइस] आर, खुला समुद्र। इसे सूंघो, दोस्तों? यह स्वतंत्रता की खुशबू है... और विद्रोह की हल्की सी गंध।”
मॉडल सिर्फ शब्दों का उच्चारण नहीं करता — यह उन्हें चरित्र में प्रदर्शन करता है।
वॉइस प्रदर्शन सिर्फ वॉल्यूम या भावना के बारे में नहीं है। यह भी महत्वपूर्ण है कि कौन बोल रहा है। Eleven v3 के साथ, आप तुरंत विशेष एक्सेंट्स, बोलियों, और बोलने की शैलियों को संकेत कर सकते हैं। उदाहरण के लिए:
[अमेरिकन एक्सेंट] क्या आप पुराने मॉडल में मेरा एक्सेंट बदल सकते थे? [उपेक्षात्मक] नहीं लगता। [ऑस्ट्रेलियन एक्सेंट] लेकिन अब आप कर सकते हैं — इसे देखें, दोस्त! [फ्रेंच एक्सेंट] मेरा प्यार... लाल, लाल गुलाब की तरह है।
इस तरह की तरल पहचान-स्विचिंग एनीमेशन, गेम्स, इंटरैक्टिव फिक्शन, या किसी भी क्षण के लिए आदर्श है जहां वक्ता की व्यक्तित्व महत्वपूर्ण होती है।
चरित्र-केंद्रित टैग्स आपको वोकल पहचान और उपस्थिति को आकार देने की अनुमति देते हैं:
लेयरिंग टैग्स पात्रों को जीवंत बनाने में मदद करते हैं: “[नाटकीय][फ्रेंच एक्सेंट] आप नहीं समझते... यह कभी बदले के बारे में नहीं था। यह नियति के बारे में था।”
मल्टी-कैरेक्टर स्क्रिप्ट्स में, ऑडियो टैग्स आवाज़ों के बीच कूदना आसान बनाते हैं। बस चरित्र प्रदर्शन को मिड-डायलॉग में स्विच करके तनाव, हास्य, या आश्चर्य जोड़ें — कोई अतिरिक्त संपादन आवश्यक नहीं।
एक डेमो से यह अंश लें: "जेसिका: [हंसते हुए] वह... सुंदर था। डॉ. वॉन फ्यूजन: [नाटकीय] होना या न होना — यही सवाल है! जेसिका: [फ्रेंच एक्सेंट] यह शानदार है, है ना?"
जो पहले एक पूरी कास्ट की आवश्यकता होती थी, अब एक ही वॉइस ट्रैक में स्क्रिप्ट किया जा सकता है — बिना रेंज या गहराई की कुर्बानी दिए।
Eleven v3 डायनामिक वोकल बदलाव, संदर्भीय शिफ्ट्स, और पात्रों के बीच लगातार डिलीवरी का समर्थन करता है। इसका मतलब है कि मॉडल न केवल समझता है क्या कहना है — बल्कि कैसे प्रत्येक चरित्र को इसे कहना चाहिए।
निर्माताओं के लिए, यह नियंत्रण का एक नया आयाम खोलता है। आप सिर्फ संवाद नहीं लिख रहे हैं। आप प्रदर्शन निर्देशित कर रहे हैं।
प्रोफेशनल वॉइस क्लोन्स (PVCs) वर्तमान में Eleven v3 के लिए पूरी तरह से अनुकूलित नहीं हैं, जिसके परिणामस्वरूप पहले के मॉडलों की तुलना में क्लोन गुणवत्ता कम हो सकती है। इस रिसर्च प्रीव्यू चरण के दौरान, यदि आपको v3 फीचर्स का उपयोग करना है, तो अपने प्रोजेक्ट के लिए एक इंस्टेंट वॉइस क्लोन (IVC) या डिज़ाइन की गई आवाज़ ढूंढना सबसे अच्छा होगा। PVC का v3 के लिए अनुकूलन निकट भविष्य में आ रहा है।
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.
Guide emotional rhythm and structural flow with tags like [pause], [awe], or [dramatic tone] for compelling storytelling.
ElevenLabs द्वारा संचालित कन्वर्सेशनल AI