.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
I november meddelade vi vår nya, snabbaste modell som genererar tal på≈400ms latens (+ nätverkslatens) och är överdubbelt så snabb som våra V1-modeller.
Tyvärr upptäckte användare att den hade svårt att uttala långa siffror. Lyssna på denna generation av "Det aktuella aktiepriset för NVIDIA är $867.49.":
Idag har vi precis släppt förbättrat sifferuttal för vår Turbo v2-modell. Här är uttalet efter ändringen:
Tack till alla användare som skickade in feedback som inspirerade denna fix - och fortsätt gärna dela områden där våra modeller kan förbättras.
Tips from latency-sensitive RAG systems in production
Predictable, created by Therapy Box, is one of the world’s leading AAC apps, empowering people with complex communication needs to express themselves with confidence and independence. At its core, Predictable helps people who cannot always rely on natural speech to communicate in ways that feel natural and personal. Now, by partnering with our ElevenLabs Impact Program, every Predictable user has free access to ElevenLabs voices.
Drivs av ElevenLabs Agenter