ElevenLabs visar upp flerspråkig AI-röstteknik med NVIDIA ACE på Computex
- Publicerad
LyssnaLyssna på den här artikeln
Vi har samarbetat med NVIDIA, pionjären inom accelererad databehandling, för att skapa nya upplevelser med ElevenLabs AI-röstteknik som låter som en människa. Keynote-presentationer har tidigare behövt livesänd tolkning eller undertexter för att stödja flera språk. Nu gör ElevenLabs det möjligt med flerspråkiga keynotes där talarens röstegenskaper bevaras med hjälp av vår egen AI-teknik för tal och
NVIDIAs grundare och vd Jensen Huang berättade om flera kapitel av honom Computex huvudtal på både engelska och mandarin med en AI-röst. Han kunde skapa AI-rösten på ElevenLabs på under en timme med bara sju minuters inspelat ljud. Denna användning av syntetisk röstteknik i keynoten markerar en vändpunkt: inte bara gör det innehåll mer tillgängligt för en bredare publik, utan det öppnar också för möjligheter att leverera nya upplevelser som tidigare var omöjliga.
Utöver grundtonen samarbetar vi för att skapa dynamiska icke-spelbara karaktärer (NPC) för videospel. Traditionellt har NPC-interaktioner varit korta och skriptade. Nu kan utvecklare lägga till mänskliga NPC:er som reagerar och anpassar sig till spelare, vilket ger en mer uppslukande och verklighetstrogen upplevelse.
NVIDIA ACE är en uppsättning teknologier för att ge digitala människor liv med generativ AI. ACE NIM mikrotjänster är byggstenarna för digitala människor, AI NPC:er och interaktiva avatarer. Utvecklare kan integrera enskilda – eller alla – ACE NIM-mikrotjänster direkt i sina produkter, verktyg, tjänster eller spel och upplevelser.




