
Eleven v3 Audio Tags: Uttryck känslomässig kontext i tal
- Kategori
- Resurser
- Datum
Så bygger vi AI-system som kommunicerar i realtid – om de tekniska valen bakom turtagning, latens och uttrycksfull leverans, samt modellerna vi har lanserat.
Vi har arbetat mot den här kategorin i flera år. Här berättar vi vad vi har lanserat och vilka forsknings- och produktval som ligger bakom.
Vår flaggskeppsprodukt – ElevenAgents med v3 Conversational
Expressive Mode – Mark – Personligt lån Inkommande (Panik) – lanseringsmaterial.mp4
Tre saker måste fungera tillsammans för att ett interaktionssystem ska ge naturliga och engagerande samtal:
*Avser endast modellens inferenstid. Den faktiska fördröjningen från start till slut kan variera beroende på till exempel din plats och vilken endpoint du använder.
Några av våra lanseringar
Spekulativ turtagning. En separat funktion i v3 Conversational som förbereder LLM-svar under användarens tystnad för att minska upplevd fördröjning.
Flash v2.5. Vår snabbaste Text to Speech-modell, framtagen för realtidsanvändning med låg fördröjning, cirka 75 ms inferenstid.*
Scribe v2. Vår Speech to Text-modell med marknadsledande noggrannhet.
ElevenAgents Expressive Mode. Gör det möjligt för agenter att använda uttryckstaggar som [skrattar], [viskar], [suckar] och [långsamt] för att styra leveransen i rätt sammanhang.
ElevenAgents Expressive Mode. Låter agenter använda uttryckstaggar som [skrattar], [viskar], [suckar] och [långsamt] för att styra leveransen i sitt sammanhang.
ElevenAgents Expressive Mode. Låter agenter använda uttryckstaggar som [skrattar], [viskar], [suckar] och [långsamt] för att styra leveransen i samtalet.
Vart vi är på väg
Många AI-samtal känns fortfarande som frågor och svar. Riktiga samtal gör inte det. Att minska det glappet är vårt jobb.




