Question 1

मुझे कौन सा टेक्स्ट टू स्पीच मॉडल इस्तेमाल करना चाहिए?

Accepted Answer

- Flash v2.5 - अल्ट्रा-लो लेटेंसी (~75ms) रियल-टाइम ऐप्लिकेशंस जैसे वॉइस एजेंट्स के लिए
- Turbo v2.5 - बैलेंस्ड क्वालिटी और स्पीड (~250-300ms) इंटरैक्टिव यूज़ केस के लिए
- Multilingual v2 - लंबी कंटेंट (10,000 कैरेक्टर्स तक) के लिए लगातार क्वालिटी
- Eleven v3 - क्रिएटिव यूज़ के लिए सबसे ज़्यादा एक्सप्रेसिव और इमोशनल रेंज

Question 2

लेटेंसी कितनी मिलेगी?

Accepted Answer

Flash v2.5 लगभग ~75ms लेटेंसी देता है।
Turbo v2.5 आमतौर पर 250-300ms में रिस्पॉन्स करता है।
दोनों में स्ट्रीमिंग आउटपुट है, जिससे ऑडियो जनरेट होने से पहले ही प्लेबैक शुरू हो सकता है।

Question 3

कितनी भाषाओं का सपोर्ट है?

Accepted Answer

Eleven v3 अब 70+ भाषाओं को सपोर्ट करता है।
Flash v2.5 और Turbo v2.5 में 32 भाषाओं का सपोर्ट है।
Multilingual v2 में 29 भाषाओं का सपोर्ट है।

Question 4

हर रिक्वेस्ट में कितने कैरेक्टर्स भेज सकते हैं?

Accepted Answer

Flash v2.5 और Turbo v2.5: 40,000 कैरेक्टर्स
Multilingual v2: 10,000 कैरेक्टर्स
Eleven v3: 3,000 कैरेक्टर्स

Question 5

क्या मैं इमोशन और डिलीवरी कंट्रोल कर सकता हूँ?

Accepted Answer

डिलीवरी, इमोशन, एम्फेसिस, पॉज़ और साउंड इफेक्ट्स कंट्रोल करने के लिए ऑडियो टैग्स ([laughs], [whispers], [sighs], [door slam]) का इस्तेमाल करें। Eleven v3 में सबसे ज़्यादा एक्सप्रेसिव कंट्रोल मिलता है।

Question 6

कितनी वॉइस उपलब्ध हैं?

Accepted Answer

वॉइस लाइब्रेरी में 10,000+ वॉइस हैं। आप वॉइस क्लोन भी कर सकते हैं या टेक्स्ट प्रॉम्प्ट्स से कस्टम वॉइस डिज़ाइन कर सकते हैं।

Question 7

क्या API में स्ट्रीमिंग सपोर्ट है?

Accepted Answer

हाँ। स्ट्रीमिंग से आप पूरा ऑडियो जनरेट होने से पहले ही प्लेबैक शुरू कर सकते हैं, जिससे रियल-टाइम ऐप्लिकेशंस में लेटेंसी कम महसूस होती है।

Question 8

क्या मैं कस्टम वॉइस इस्तेमाल कर सकता हूँ?

Accepted Answer

हाँ। अपनी लाइब्रेरी में किसी भी वॉइस को वॉइस ID से रेफर कर सकते हैं, जिसमें प्रोफेशनल वॉइस क्लोन, इंस्टेंट वॉइस क्लोन और आपने डिज़ाइन की हुई वॉइस भी शामिल हैं।

Question 9

कौन-कौन से ऑडियो फॉर्मेट्स सपोर्टेड हैं?

Accepted Answer

API डिफॉल्ट रूप से MP3 आउटपुट देता है। अतिरिक्त फॉर्मेट्स में PCM और μ-law भी शामिल हैं।

Question 10

लेटेंसी कम करने के लिए क्या करें?

Accepted Answer

Flash v2.5 को स्ट्रीमिंग के साथ इस्तेमाल करें। रिक्वेस्ट 1,000 कैरेक्टर्स से कम रखें। रियल-टाइम ऐप्लिकेशंस के लिए WebSocket कनेक्शन ऑन करें।

Question 11

क्या प्रोनन्सिएशन कस्टमाइज़ कर सकते हैं?

Accepted Answer

हाँ। फोनेटिक स्पेलिंग या प्रोनन्सिएशन डिक्शनरीज़ से आप तय कर सकते हैं कि कौन सा शब्द कैसे बोला जाए।

Question 12

कौन-कौन से SDKs उपलब्ध हैं?

Accepted Answer

Python और JavaScript/TypeScript के लिए ऑफिशियल SDKs उपलब्ध हैं। आप HTTP API भी इस्तेमाल कर सकते हैं।

Question 13

कोड के उदाहरण कहाँ मिलेंगे?

Accepted Answer

पूरा API रेफरेंस, कोड उदाहरण और इंटीग्रेशन गाइड्स elevenlabs.io/docs/api-reference पर उपलब्ध हैं।

Question 14

क्या आप एंटरप्राइज सपोर्ट देते हैं?

Accepted Answer

हाँ। एंटरप्राइज प्लान्स में SOC 2 कंप्लायंस, HIPAA सपोर्ट, GDPR कंप्लायंस, EU डेटा रेजिडेंसी, ज़ीरो रिटेंशन मोड, डेडिकेटेड सपोर्ट और कस्टम SLA शामिल हैं।

टेक्स्ट टू स्पीच API

अल्ट्रा-रियलिस्टिक और लो लेटेंसी स्पीच जनरेशन

सबसे पावरफुल वॉइस AI मॉडल्स पर बना

फ्लैश v2.5

टर्बो v2.5

मल्टीलिंगुअल v2

इलेवन v3

प्रोडक्शन के लिए तैयार स्पीच बनाने के लिए सब कुछ

इमोशन और डिलीवरी कंट्रोल करें

10,000+ वॉइस एक्सेस करें

वॉइस डिज़ाइन और क्लोनिंग

मल्टी-स्पीकर डायलॉग

ऑडियो इवेंट्स और डायरेक्शन

प्रोनन्सिएशन डिक्शनरीज़

दुनिया की प्रमुख कंपनियों और ब्रांड्स को पावर दे रहे हैं

प्रोडक्शन के लिए बने APIs

एंटरप्राइज-लेवल डेटा सुरक्षा

Python और TypeScript SDKs

बेहतर सपोर्ट और कस्टम डिप्लॉयमेंट्स

अक्सर पूछे जाने वाले प्रश्न

लेटेस्ट अपडेट्स