
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
सबसे अभिव्यक्तिपूर्ण टेक्स्ट टू स्पीच मॉडल
हम आपको यह बताते हुए खुश हैं Eleven v3 (अल्फा) — सबसे अभिव्यक्तिपूर्ण टेक्स्ट टू स्पीच मॉडल।
यह रिसर्च प्रीव्यू स्पीच जनरेशन में अभूतपूर्व नियंत्रण और यथार्थवाद लाता है:
Eleven v3 (अल्फा) को पिछले मॉडलों की तुलना में अधिक प्रॉम्प्ट इंजीनियरिंग की आवश्यकता होती है — लेकिन इसके जनरेशन अद्भुत हैं।
यदि आप वीडियो, ऑडियोबुक, या मीडिया टूल्स पर काम कर रहे हैं — यह अभिव्यक्ति के नए स्तर को खोलता है। रियल-टाइम और कन्वर्सेशनल उपयोग के लिए, हम अभी v2.5 Turbo या Flash का उपयोग करने की सलाह देते हैं। v3 का रियल-टाइम संस्करण विकास में है।
Eleven v3 आज हमारी वेबसाइट पर उपलब्ध है। सार्वजनिक API एक्सेस जल्द ही आ रहा है। प्रारंभिक एक्सेस के लिए, कृपया सेल्स से संपर्क करें.
ElevenLabs ऐप में नए मॉडल का उपयोग जून के अंत तक 80% छूट पर है। साइन अप करें यहां.
हमने v3 क्यों बनायाअभिव्यक्तिपूर्णता. अधिक बढ़ी-चढ़ी भावनाएं, बातचीत में रुकावटें, और विश्वसनीय संवाद बनाना मुश्किल था।
मल्टीलिंगुअल v2 लॉन्च करने के बाद से, हमने देखा कि वॉइस AI का उपयोग प्रोफेशनल फिल्म, गेम डेवलपमेंट, शिक्षा, और एक्सेसिबिलिटी में किया जा रहा है। लेकिन लगातार सीमा ध्वनि की गुणवत्ता नहीं थी — यह
Feature | What it unlocks |
---|---|
Audio tags | Inline control of tone, emotion, and non-verbal reactions |
Dialogue mode | Multi-speaker conversations with natural pacing and interruptions |
70+ languages | Full coverage of high-demand global languages |
Deeper text understanding | Better stress, cadence, and expressivity from text input |
ऑडियो टैग्स का उपयोगडॉक्स में v3 के लिए प्रॉम्प्टिंग गाइड.
ऑडियो टैग्स आपके स्क्रिप्ट के साथ इनलाइन रहते हैं और लोअरकेस स्क्वायर ब्रैकेट्स के साथ फॉर्मेट किए जाते हैं। आप हमारे
1 | “[happily][shouts] We did it! [laughs].” |
मल्टी-स्पीकर संवाद बनानाText to Dialogue API endpoint. Provide a structured array of JSON objects — each representing a speaker turn — and the model generates a cohesive, overlapping audio file:
1 | [ |
2 | {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."}, |
3 | {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."}, |
4 | {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"} |
5 | ] |
6 |
Eleven v3 हमारे मौजूदा टेक्स्ट टू स्पीच एंडपॉइंट में समर्थित है। इसके अलावा, हम एक नया
एंडपॉइंट स्वचालित रूप से स्पीकर ट्रांज़िशन, भावनात्मक परिवर्तन, और रुकावटों को प्रबंधित करता है।here.
Plan | Launch promo | After 30 days |
---|---|---|
UI (self-serve) | 80% off (~5× cheaper) | Same as Multilingual V2 |
API (self-serve & enterprise) | Same as Multilingual V2 | Same |
Enterprise UI | Same as Multilingual V2 | Same |
मूल्य निर्धारण और उपलब्धता
v3 को सक्षम करने के लिए:contact sales.
API एक्सेस और स्टूडियो में सपोर्ट जल्द ही आ रहा है। जल्दी एक्सेस के लिए कृपया
कब v3 का उपयोग न करेंv3 documentation and FAQ.
We’re excited to see how you bring v3 to life across new use cases — from immersive storytelling to cinematic production pipelines.
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
ElevenLabs द्वारा संचालित एजेंट्स