Salta al contenuto

Stiamo arrivando in Corea per rendere l’IA vocale parte della vita quotidiana

Portiamo la nostra IA vocale in uno dei mercati più connessi e innovativi al mondo.

ElevenLabs Korea

Questa settimana siamo stati in Corea per celebrare il nostro lancio ufficiale. Qui la tecnologia si evolve rapidamente, le idee viaggiano veloci e le persone hanno standard di qualità molto alti. È anche uno dei paesi più connessi al mondo, con accesso mobile quasi universale, la migliore infrastruttura 5G e un forte sostegno governativo alla ricerca sull’IA.

Abbiamo fondato ElevenLabs a Londra nel 2022 per dare voce alla tecnologia con l’IA. Fin dall’inizio, il nostro obiettivo è stato rendere naturale la comunicazione tra persone e macchine, in ogni lingua. La Corea è il luogo ideale per continuare a costruire questa visione.

Perché la Corea è importante

Oltre il 65% delle grandi aziende in Corea utilizza già l’IA e quasi due terzi dei lavoratori usano l’IA generativa nel lavoro quotidiano. Il governo ha annunciato nuovi importanti investimenti nell’IA e punta a rendere la Corea uno dei primi tre paesi al mondo in questo settore.

Ma oltre ai numeri, la Corea è un paese che adotta presto le nuove idee. Qui industrie creative come K-pop e K-drama influenzano la cultura globale e le aspettative sui prodotti digitali sono tra le più alte in assoluto. Per noi è un banco di prova per capire come deve essere una buona IA.

Cosa portiamo

La nostra ricerca copre tutta la filiera dell’audio IA: text to speech, speech to text, doppiaggio, clonazione vocale ed effetti sonori. Questi modelli ora supportano oltre 70 lingue e riescono a cogliere tono, emozione e sfumature con una fedeltà mai vista prima, ma il vero salto in avanti sta nell’integrazione in tempo reale di questi sistemi.

La nostra Agent Platform collega riconoscimento vocale, generazione e ragionamento in un unico sistema. Permette a prodotti e servizi di interagire con le persone tramite conversazioni naturali, con una latenza inferiore a mezzo secondo. Supporta oltre 7.000 voci e 32 lingue e si integra direttamente con strumenti come CRM, pagamenti e telefonia.

Una grande banca digitale con oltre 30 milioni di clienti ha ridotto dell’85% i tempi di gestione dopo aver adottato la piattaforma. Ora automatizza metà delle richieste sulle carte di credito e l’implementazione completa ha richiesto meno di due mesi.

Altri sistemi end-to-end speech-to-speech hanno difficoltà con osservabilità e audit. Il nostro è stato progettato per rispettare gli standard enterprise. I miglioramenti nei modelli di streaming ASR e TTS, insieme a un’inferenza LLM più veloce, hanno ridotto visibilmente la latenza e aumentato l’affidabilità.

Come vediamo il futuro

Crediamo che il futuro dell’audio IA andrà oltre la voce. Ogni dispositivo, dagli indossabili alle auto, capirà non solo cosa diciamo ma anche come lo diciamo. Traduzione e doppiaggio in tempo reale elimineranno del tutto le barriere linguistiche. E quando la voce si unirà a immagini e video, nasceranno nuove esperienze creative, personali e immediate.

Collaboriamo con partner coreani

Il nostro Korea Country Lead, Sangwon Hong, e il team locale stanno già lavorando con aziende come MBC C&I, ESTsoft, Krafton e SBS. Insieme vogliamo fare della Corea non solo un mercato, ma un centro per l’IA vocale in Asia.

Siamo anche impegnati a garantire un uso responsabile dell’IA. Il nostro Framework 3C – Consenso, Controllo e Compenso – aiuta a prevenire abusi e assicura riconoscimento e condivisione del valore in modo equo.

Siamo entusiasti di costruire in Corea, imparare da questo paese e crescere insieme a aziende, sviluppatori e creatori locali. Qui si detta il ritmo di ciò che verrà, e siamo felici di farne parte.

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità