
डेवलपर्स के लिए ElevenAPI
मिनटों में उत्पादन के लिए तैयार ऑडियो AI बनाएं
टेक्स्ट टू स्पीच, स्पीच टू टेक्स्ट, वॉइस एजेंट्स, और म्यूजिक APIs — बड़े पैमाने पर शिपिंग करने वाली टीमों द्वारा भरोसेमंद।
प्राचीन भूमि एल्डोरिया में, जहाँ आकाश चमकते थे और जंगल हवा को राज़ फुसफुसाते थे, वहाँ ज़ेफिरोस नाम का एक ड्रैगन रहता था। [sarcastically] वह “सब कुछ जला दो” वाला नहीं था... [giggles] बल्कि वह कोमल, बुद्धिमान था, जिसकी आँखें पुराने सितारों जैसी थीं। [whispers] जब वह गुजरता था तो पक्षी भी चुप हो जाते थे।
टेक्स्ट टू स्पीच API
ट्रांसक्रिप्शन
म्यूजिक
साउंड इफेक्ट्स
- Lovable
- Synthesia
- Stripe
- Perplexity
- Twilio
ElevenLabs APIs के पूरे सेट के साथ निर्माण करें
ElevenLabs के नेटिव TypeScript और Python SDKs या हमारे REST API के साथ कोई भी ऑडियो प्रोजेक्ट बनाएं। विस्तृत डेमो, उदाहरण और दस्तावेज़ के साथ शुरू करें।
स्पीच जनरेट करें
दुनिया के सबसे अभिव्यक्तिपूर्ण वॉइस मॉडल के साथ टेक्स्ट को स्पीच में बदलें।

स्पीच ट्रांसक्राइब करें
किसी भी प्लेटफ़ॉर्म के लिए रियलटाइम या बैच स्पीच टू टेक्स्ट।

म्यूजिक कंपोज़ करें
पूर्ण लचीलापन के साथ स्टेम्स, लिरिक्स, और पूर्ण रचनाएँ जनरेट करें।

साउंड इफेक्ट्स बनाएं
सहज लूपिंग, किसी भी लंबाई में, पेशेवर-ग्रेड साउंड इफेक्ट्स।

वॉइस बनाएं
किसी की आवाज़ क्लोन करें, एक प्रॉम्प्ट के साथ जनरेट करें, या हमारे मौजूदा 10k वॉइसेस में से एक का उपयोग करें।

एजेंट्स डिप्लॉय करें
मोबाइल और वेब के लिए नेटिव SDKs के साथ पूरी तरह से प्रबंधित एजेंट्स प्लेटफ़ॉर्म।

दुनिया की अग्रणी कंपनियों और ब्रांड्स को शक्ति देना
“ElevenLabs ने हमारी ऑडियो सीरीज़ निर्माण को तेज़ और सरल बना दिया है, लागत को 90% तक कम कर दिया है”
“Toyota ने H/L और ElevenLabs के साथ मिलकर एक वॉइस-ड्रिवन मार्केटिंग एक्टिवेशन प्रदान किया, जिसमें क्वार्टरबैक ब्रॉक पर्डी का AI संस्करण शामिल था। इस अभियान ने 12,000 से अधिक इंटरैक्शन उत्पन्न किए, औसतन दो मिनट की सहभागिता, और 25 प्रतिशत से अधिक बातचीत ने सार्थक कार्यों की ओर अग्रसर किया।”
“NVIDIA ने ElevenLabs वॉइस क्लोनिंग तकनीक का उपयोग करके जेनसन हुआंग के कीनोट के कुछ हिस्सों को अंग्रेजी और मंदारिन दोनों में लाइव सुनाया।”
“ElevenLabs के उन्नत AI समाधान अत्याधुनिक हैं, उच्च गुणवत्ता और बहु-भाषा ऑडियो अनुभव सुनिश्चित करते हैं”
पहले दिन से उत्पादन के लिए तैयार APIs

अक्सर पूछे जाने वाले प्रश्न
ElevenLabs API हमारे AI मॉडल्स के लिए प्रोग्रामेटिक एक्सेस प्रदान करता है, जिसमें वॉइस, म्यूजिक, साउंड इफेक्ट्स, डबिंग, और ट्रांसक्रिप्शन शामिल हैं। आप इन क्षमताओं को सीधे अपने एप्लिकेशन्स, वर्कफ़्लोज़, और प्रोडक्शन पाइपलाइन्स में एकीकृत कर सकते हैं।
टेक्स्ट टू स्पीच - टेक्स्ट से वॉइस जनरेट करें
स्पीच टू टेक्स्ट - ऑडियो ट्रांसक्राइब और डायराइज करें
वॉइस लाइब्रेरी - वॉइसेस एक्सेस और क्लोन करें
डबिंग - 70+ भाषाओं में ऑडियो का अनुवाद और स्थानीयकरण करें
साउंड इफेक्ट्स - कस्टम ऑडियो जनरेट करें
म्यूजिक - इंस्ट्रूमेंटल और लिरिकल ट्रैक्स बनाएं
वॉइस आइसोलेशन - बैकग्राउंड नॉइज़ हटाएं
सामान्य उपयोग के मामले में सामग्री स्थानीयकरण पाइपलाइन्स, स्वचालित वीडियो उत्पादन, संवादात्मक इंटरफेस, एक्सेसिबिलिटी टूल्स, और प्रशिक्षण सामग्री जनरेशन शामिल हैं। API को रियल-टाइम और बैच प्रोसेसिंग दोनों के लिए डिज़ाइन किया गया है।
सभी API अनुरोधों के लिए xi-api-key हेडर में एक API कुंजी की आवश्यकता होती है। कुंजियाँ आपके खाता सेटिंग्स में उत्पन्न होती हैं और विशिष्ट वर्कस्पेस के लिए स्कोप की जा सकती हैं।
उपयोग की सीमाएँ योजना और एंडपॉइंट के अनुसार भिन्न होती हैं। PAYG उपयोग हमारे स्टार्टर प्लान और उससे ऊपर से सक्षम है।
हाँ। आधिकारिक SDKs Python और JavaScript/TypeScript के लिए उपलब्ध हैं, और हमारे एजेंट्स प्लेटफ़ॉर्म के लिए Flutter, Swift, और Kotlin जैसे अतिरिक्त प्लेटफ़ॉर्म्स के लिए भी।
टेक्स्ट टू स्पीच प्रति कैरेक्टर बिल किया जाता है। स्पीच टू टेक्स्ट प्रति ऑडियो मिनट बिल किया जाता है। म्यूजिक और साउंड इफेक्ट्स प्रति जनरेशन बिल किए जाते हैं। डबिंग प्रति स्रोत ऑडियो मिनट बिल की जाती है।
हाँ। आप अपनी लाइब्रेरी में किसी भी वॉइस को ID द्वारा संदर्भित कर सकते हैं, जिसमें पेशेवर वॉइसेस, क्लोन वॉइसेस, और आपके द्वारा डिज़ाइन की गई वॉइसेस शामिल हैं।
हाँ। ElevenLabs मॉडल्स का उपयोग करके API के माध्यम से जनरेट की गई सामग्री व्यावसायिक रूप से लाइसेंस प्राप्त है। म्यूजिक के लिए विज्ञापन, फिल्म, टीवी, गेम्स, और एंटरप्राइज वितरण के लिए एक अतिरिक्त लाइसेंस की आवश्यकता होती है।
टेक्स्ट टू स्पीच आमतौर पर स्ट्रीमिंग के लिए 500ms से कम में प्रतिक्रिया करता है। स्पीच टू टेक्स्ट 20-50x रियल-टाइम पर प्रोसेस करता है, फ़ाइल आकार के आधार पर। डबिंग और म्यूजिक बैच ऑपरेशन्स हैं जिनकी प्रोसेसिंग समय सामग्री की लंबाई के अनुपात में होती है।
हाँ। टेक्स्ट टू स्पीच और स्पीच टू टेक्स्ट दोनों स्ट्रीमिंग आउटपुट का समर्थन करते हैं, जिससे आप APIs को रियल-टाइम एप्लिकेशन्स में उपयोग कर सकते हैं।
API मानक HTTP स्थिति कोड लौटाता है। दर सीमा त्रुटियाँ 429 लौटाती हैं। अमान्य अनुरोध 400 के साथ त्रुटि विवरण लौटाते हैं। प्रमाणीकरण विफलताएँ 401 लौटाती हैं।
पूर्ण API रेफरेंस, कोड उदाहरण, और एकीकरण गाइड elevenlabs.io/docs/api-reference पर उपलब्ध हैं।
हाँ। एंटरप्राइज योजनाओं में समर्पित समर्थन, SLAs, कस्टम दर सीमाएँ, SSO, SOC 2 अनुपालन, और MSAs शामिल हैं।
.webp&w=3840&q=80)




.webp&w=3840&q=80)

.webp&w=3840&q=80)