
Duvo ने सिर्फ एक हफ्ते में ElevenAgents के साथ प्रोडक्शन वॉइस एजेंट्स तैनात किए
- श्रेणी
- ग्राहकों के अनुभव
- तारीख
Speech Engine से मिलिए
सिर्फ एक प्रॉम्प्ट से अपने मौजूदा चैट एजेंट में इंसानों जैसी वॉइस जोड़ें। वॉइस की जिम्मेदारी हमारी है। आपके एजेंट का LLM, RAG और आर्किटेक्चर वैसा ही रहेगा।
स्पीच इंजन आपके मौजूदा स्टैक के ऊपर आसानी से जुड़ जाता है। कुछ भी दोबारा बनाना नहीं पड़ता और आपका टेक्स्ट-बेस्ड एजेंट वैसा ही रहता है।

स्पीच इंजन हमारे बेहतरीन स्पीच, ट्रांसक्रिप्शन और वॉइस ऑर्केस्ट्रेशन मॉडल्स को एक ही पाइपलाइन में जोड़ता है - सब कुछ खास तौर पर एक साथ बेहतर काम करने के लिए बनाया गया है।
वॉइस सबसे तेज़ और असरदार तरीका है जानकारी साझा करने का, जिससे प्रोडक्ट्स और सर्विसेज़ ग्राहकों के लिए और भी आसान हो जाते हैं।
हमारे वॉइस मॉडल बातचीत के लिए ऑप्टिमाइज़ किए गए हैं, जो असली माहौल में अल्ट्रा-लो लेटेंसी देते हैं।
डेडिकेटेड मॉडल्स ओवरलैपिंग स्पीच और बीच में बदलाव को बिना किसी कस्टम लॉजिक के संभाल लेते हैं।
व्यक्तिगत, इंसानों जैसी आवाज़ें पाएं जो कई भाषाओं में हर तरह की भावनाओं को सपोर्ट करती हैं।
हर कंपोनेंट को साथ में सबसे अच्छा काम करने के लिए बनाया और ऑप्टिमाइज़ किया गया है।
हमारा ट्रांसक्रिप्शन मॉडल बातचीत की सटीकता के लिए ऑप्टिमाइज़ किया गया है, जो यूज़र की स्पीच को सिर्फ 80ms की अल्ट्रा-लो लेटेंसी पर ट्रांसक्राइब करता है।
70+ भाषाओं में एक्सप्रेसिव, इंसान जैसे वॉइस। हमारी 11,000+ वॉइस लाइब्रेरी से चुनें या वॉइस क्लोनिंग से खुद की वॉइस बनाएं।
जानता है कि यूज़र ने बोलना कब खत्म किया है और कब सिर्फ पॉज़ किया है - जिससे ट्रांसक्रिप्ट आपके LLM को सही समय पर भेजा जाता है।
एजेंट के बोलते समय यूज़र की स्पीच को मॉनिटर करता है। जैसे ही यूज़र बोलता है, प्लेबैक तुरंत रुक जाता है और वापस लूप हो जाता है।
इनपुट लेवल पर बैकग्राउंड नॉइज़ से स्पीच को फिल्टर करता है, ताकि ट्रांसक्रिप्शन मॉडल तक सिर्फ साफ ऑडियो पहुंचे।
पूरे वॉइस लाइफसाइकल को मैनेज करता है - यूज़र ऑडियो कैप्चर करने से लेकर एजेंट की स्पोकन रिस्पॉन्स देने तक।
हमारे स्किल के साथ एक कमांड में इंस्टॉल करें। यह स्किल सब कुछ सेटअप कर देता है, जिससे आप एक ही प्रॉम्प्ट में चैट से वॉइस पर जा सकते हैं।
स्पीच इंजन को अपने सर्वर से जोड़ें। ट्रांसक्रिप्ट्स पाएं, उन्हें अपने LLM को भेजें, और रिस्पॉन्स वापस भेजें - ये सब कुछ ही लाइनों में।
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";
const elevenlabs = new ElevenLabsClient({
apiKey: process.env.ELEVENLABS_API_KEY,
});
const engine = await elevenlabs.speechEngine.create({
name: "My Speech Engine",
speechEngine: {
// Note we use the wss protocol instead of https
wsUrl: "wss://abc123.ngrok.io/ws",
},
});
console.log("Speech Engine ID:", engine.engineId);पहले से बने UI कंपोनेंट्स - एजेंट ऑर्ब्स, वेवफॉर्म्स और चैट विजेट्स - जोड़ें या इसी SDK पर अपना खुद का UI बनाएं।

ब्राउज़र या मोबाइल ऐप से सिर्फ तीन लाइनों में कन्वर्सेशन सेशन शुरू करें। वही क्लाइंट इंटीग्रेशन जो ElevenAgents में है, इसलिए बाद में अपग्रेड करने के लिए कोई बदलाव नहीं करना पड़ेगा।
import express from "express";
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";
const app = express();
const elevenlabs = new ElevenLabsClient({ apiKey: process.env.ELEVENLABS_API_KEY });
const speechEngineId = "seng_8k3m9xr4hjnfg983brhmhkd98n6";
app.get("/api/token", async (req, res) => {
const { token } = await elevenlabs.conversationalAi.conversations.getWebrtcToken({ agentId: speechEngineId });
res.json({ token });
});
app.listen(3002, () => console.log("Token server listening on port 3002"));हमारा प्लेटफॉर्म बड़े पैमाने पर डिप्लॉयमेंट के लिए डिज़ाइन किया गया है, जिसमें एंटरप्राइज-लेवल डेटा प्रोटेक्शन है, जैसे SOC 2, HIPAA और GDPR कंप्लायंस। EU डेटा रेजिडेंसी और ज़ीरो रिटेंशन मोड भी उपलब्ध हैं, ताकि डेटा पर और ज्यादा कंट्रोल मिल सके।


मैक्सिमम फ्लेक्सिबिलिटी

मैक्सिमम परफॉर्मेंस
कोई भी LLM जो टेक्स्ट जनरेट करता है। SDK में OpenAI (Responses API और Chat Completions API), Anthropic Messages API, और Google Gemini API के लिए इनबिल्ट स्ट्रीम एक्सट्रैक्शन है। बाकी प्रोवाइडर्स के लिए, आप सिंपल स्ट्रिंग या स्ट्रिंग चंक्स की async iterable पास कर सकते हैं।
ElevenAgents एक फुली-होस्टेड प्लेटफॉर्म है जिसमें ElevenLabs LLM, नॉलेज बेस और टूल्स देता है। स्पीच इंजन उन डेवलपर्स के लिए है जो अपना LLM लाना चाहते हैं और कन्वर्सेशन लॉजिक अपने सर्वर पर कंट्रोल करना चाहते हैं।
TypeScript में, आप स्पीच इंजन को किसी भी Node.js HTTP सर्वर (Express, Fastify, या सिंपल http.createServer()) से जोड़ सकते हैं, या स्टैंडअलोन WebSocket सर्वर चला सकते हैं। Python में, SDK engine.serve() के ज़रिए स्टैंडअलोन सर्वर देता है, या आप FastAPI, Starlette, या किसी भी ASGI फ्रेमवर्क के साथ engine.create_session() से इंटीग्रेट कर सकते हैं।



