कौन-कौन से LLM सपोर्टेड हैं?

कोई भी LLM जो टेक्स्ट जनरेट करता है। SDK में OpenAI (Responses API और Chat Completions API), Anthropic Messages API, और Google Gemini API के लिए इनबिल्ट स्ट्रीम एक्सट्रैक्शन है। बाकी प्रोवाइडर्स के लिए, आप सिंपल स्ट्रिंग या स्ट्रिंग चंक्स की async iterable पास कर सकते हैं।

स्पीच इंजन और ElevenAgents में क्या फर्क है?

ElevenAgents एक फुली-होस्टेड प्लेटफॉर्म है जिसमें ElevenLabs LLM, नॉलेज बेस और टूल्स देता है। स्पीच इंजन उन डेवलपर्स के लिए है जो अपना LLM लाना चाहते हैं और कन्वर्सेशन लॉजिक अपने सर्वर पर कंट्रोल करना चाहते हैं।

कौन-कौन से सर्वर फ्रेमवर्क सपोर्टेड हैं?

TypeScript में, आप स्पीच इंजन को किसी भी Node.js HTTP सर्वर (Express, Fastify, या सिंपल http.createServer()) से जोड़ सकते हैं, या स्टैंडअलोन WebSocket सर्वर चला सकते हैं। Python में, SDK engine.serve() के ज़रिए स्टैंडअलोन सर्वर देता है, या आप FastAPI, Starlette, या किसी भी ASGI फ्रेमवर्क के साथ engine.create_session() से इंटीग्रेट कर सकते हैं।

Speech Engine से मिलिए

अपने चैट एजेंट को वॉइस एजेंट में बदलें

शुरू करें सेल्स से संपर्क करें

सिर्फ एक प्रॉम्प्ट से अपने मौजूदा चैट एजेंट में इंसानों जैसी वॉइस जोड़ें। वॉइस की जिम्मेदारी हमारी है। आपके एजेंट का LLM, RAG और आर्किटेक्चर वैसा ही रहेगा।

अपने मौजूदा स्टैक में वॉइस लेयर जोड़ें

शुरू करें

स्पीच इंजन आपके मौजूदा स्टैक के ऊपर आसानी से जुड़ जाता है। कुछ भी दोबारा बनाना नहीं पड़ता और आपका टेक्स्ट-बेस्ड एजेंट वैसा ही रहता है।

पूरी वॉइस लेयर, एक ही इंटीग्रेशन में

स्पीच इंजन हमारे बेहतरीन स्पीच, ट्रांसक्रिप्शन और वॉइस ऑर्केस्ट्रेशन मॉडल्स को एक ही पाइपलाइन में जोड़ता है - सब कुछ खास तौर पर एक साथ बेहतर काम करने के लिए बनाया गया है।

Speech Engine

Speech to Text

Turn Detection

Interrupt Detection

Text to Speech

Audio Orchestration

अपने चैटबॉट को वॉइस के साथ बेहतर बनाएं

वॉइस सबसे तेज़ और असरदार तरीका है जानकारी साझा करने का, जिससे प्रोडक्ट्स और सर्विसेज़ ग्राहकों के लिए और भी आसान हो जाते हैं।

बिना रुके बातचीत का अनुभव

हमारे वॉइस मॉडल बातचीत के लिए ऑप्टिमाइज़ किए गए हैं, जो असली माहौल में अल्ट्रा-लो लेटेंसी देते हैं।

टर्न-टेकिंग और इंटरप्शन हैंडलिंग

डेडिकेटेड मॉडल्स ओवरलैपिंग स्पीच और बीच में बदलाव को बिना किसी कस्टम लॉजिक के संभाल लेते हैं।

70+ भाषाओं में ग्लोबल कवरेज

व्यक्तिगत, इंसानों जैसी आवाज़ें पाएं जो कई भाषाओं में हर तरह की भावनाओं को सपोर्ट करती हैं।

मिलियनों असली बातचीतों में आज़माया गया वॉइस स्टैक

हर कंपोनेंट को साथ में सबसे अच्छा काम करने के लिए बनाया और ऑप्टिमाइज़ किया गया है।

स्पीच टू टेक्स्ट

हमारा ट्रांसक्रिप्शन मॉडल बातचीत की सटीकता के लिए ऑप्टिमाइज़ किया गया है, जो यूज़र की स्पीच को सिर्फ 80ms की अल्ट्रा-लो लेटेंसी पर ट्रांसक्राइब करता है।

टेक्स्ट टू स्पीच

70+ भाषाओं में एक्सप्रेसिव, इंसान जैसे वॉइस। हमारी 11,000+ वॉइस लाइब्रेरी से चुनें या वॉइस क्लोनिंग से खुद की वॉइस बनाएं।

टर्न डिटेक्शन

जानता है कि यूज़र ने बोलना कब खत्म किया है और कब सिर्फ पॉज़ किया है - जिससे ट्रांसक्रिप्ट आपके LLM को सही समय पर भेजा जाता है।

इंटरप्शन हैंडलिंग

एजेंट के बोलते समय यूज़र की स्पीच को मॉनिटर करता है। जैसे ही यूज़र बोलता है, प्लेबैक तुरंत रुक जाता है और वापस लूप हो जाता है।

वॉइस एक्टिविटी डिटेक्शन

इनपुट लेवल पर बैकग्राउंड नॉइज़ से स्पीच को फिल्टर करता है, ताकि ट्रांसक्रिप्शन मॉडल तक सिर्फ साफ ऑडियो पहुंचे।

ऑडियो ऑर्केस्ट्रेशन

पूरे वॉइस लाइफसाइकल को मैनेज करता है - यूज़र ऑडियो कैप्चर करने से लेकर एजेंट की स्पोकन रिस्पॉन्स देने तक।

सिर्फ एक प्रॉम्प्ट से अपने एजेंट में स्पीच इंजन जोड़ें

हमारे स्किल के साथ एक कमांड में इंस्टॉल करें। यह स्किल सब कुछ सेटअप कर देता है, जिससे आप एक ही प्रॉम्प्ट में चैट से वॉइस पर जा सकते हैं।

सर्वर SDK

स्पीच इंजन को अपने सर्वर से जोड़ें। ट्रांसक्रिप्ट्स पाएं, उन्हें अपने LLM को भेजें, और रिस्पॉन्स वापस भेजें - ये सब कुछ ही लाइनों में।

import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";
const elevenlabs = new ElevenLabsClient({
  apiKey: process.env.ELEVENLABS_API_KEY,
});
const engine = await elevenlabs.speechEngine.create({
  name: "My Speech Engine",
  speechEngine: {
    // Note we use the wss protocol instead of https
    wsUrl: "wss://abc123.ngrok.io/ws",
  },
});
console.log("Speech Engine ID:", engine.engineId);

ElevenLabs UI

पहले से बने UI कंपोनेंट्स - एजेंट ऑर्ब्स, वेवफॉर्म्स और चैट विजेट्स - जोड़ें या इसी SDK पर अपना खुद का UI बनाएं।

ElevenLabs UI देखें

Chat interface with options for customer support and text input field. "Yes, for John Johnson please" visible.

क्लाइंट SDK

ब्राउज़र या मोबाइल ऐप से सिर्फ तीन लाइनों में कन्वर्सेशन सेशन शुरू करें। वही क्लाइंट इंटीग्रेशन जो ElevenAgents में है, इसलिए बाद में अपग्रेड करने के लिए कोई बदलाव नहीं करना पड़ेगा।

import express from "express";
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import "dotenv/config";

const app = express();
const elevenlabs = new ElevenLabsClient({ apiKey: process.env.ELEVENLABS_API_KEY });
const speechEngineId = "seng_8k3m9xr4hjnfg983brhmhkd98n6";

app.get("/api/token", async (req, res) => {
  const { token } = await elevenlabs.conversationalAi.conversations.getWebrtcToken({ agentId: speechEngineId });
  res.json({ token });
});

app.listen(3002, () => console.log("Token server listening on port 3002"));

एंटरप्राइज़-ग्रेड सुरक्षा

हमारा प्लेटफॉर्म बड़े पैमाने पर डिप्लॉयमेंट के लिए डिज़ाइन किया गया है, जिसमें एंटरप्राइज-लेवल डेटा प्रोटेक्शन है, जैसे SOC 2, HIPAA और GDPR कंप्लायंस। EU डेटा रेजिडेंसी और ज़ीरो रिटेंशन मोड भी उपलब्ध हैं, ताकि डेटा पर और ज्यादा कंट्रोल मिल सके।

और जानें