Voice Design - La prima IA generativa per l’audio

Pubblicato: 28 feb 2023

AscoltaAscolta questo articolo

0:00

0:000:00

Il mese scorso abbiamo annunciato che stava per arrivare il nostro modello generativo per la creazione di voci. Ora è finalmente disponibile ed è il primo nel suo genere: lo chiamiamo Voice Design. Questa funzione ti permette di creare nuove voci da zero scegliendo caratteristiche fondamentali come genere, età e accento. Anche impostando gli stessi parametri di base, il nostro modello aggiunge ogni volta un tocco di casualità quando generi una voce, così ogni risultato è davvero unico.

Try Voice Design

Voice Design

Il modello dietro Voice Design nasce in gran parte dalla nostra ricerca sulla sintesi vocale e sulla

Aggiungere un certo grado di controllo nella selezione delle voci era importante, perché spesso chi usa ElevenLabs cerca caratteristiche vocali precise per i propri script. Garantire che ogni voce generata sia unica era altrettanto fondamentale, visto che molti casi d’uso richiedono, o comunque traggono vantaggio, dall’avere accesso esclusivo a una voce. Oltre a offrire un nuovo spazio creativo, le voci generate con Voice Design sono completamente artificiali e non appartengono a nessuna persona reale.

Applicazioni

Oltre a trasformare facilmente i testi in audio di qualità con il nostro strumento di punta Sintesi vocale, gli autori di libri ora possono usare Voice Design per avere pieno controllo artistico sulla narrazione e dare a ogni personaggio una voce su misura.

Gli editori di notizie che si avvicinano all’audio hanno bisogno di voci per le loro storie. Poiché i narratori diventano parte dell’identità delle pubblicazioni che rappresentano, scegliere la voce giusta è una decisione importante che spesso non si ripete. Con Voice Design, gli editori possono scegliere e confrontare praticamente infiniti narratori in tempo reale. Inoltre, possono avere la certezza che una voce rappresenti solo loro.

Gli sviluppatori di videogiochi non devono più scegliere se un personaggio merita i costi di registrazione. Decine di migliaia di NPC prima muti ora possono avere personalità uniche, ampliando i confini dell’immersione virtuale.

Che tu sia un creatore di contenuti al lavoro sulla prossima uscita o un responsabile aziendale che vuole dare voce alle comunicazioni della propria azienda, ora puoi creare audio realistici e coinvolgenti per ogni esigenza e pubblico.

Ecosistema

Voice Design è una delle tante funzioni per l’editing della narrazione che introdurremo quest’anno. La prossima sarà Studio – la nostra nuova workstation per strutturare testi lunghi, inserire pause, rigenerare parti di audio e assegnare sezioni di testo a speaker diversi. Studio arriverà a fine marzo e sarà arricchito dal supporto all’editing dell’intonazione nel corso del secondo trimestre.

Voice Design - La prima IA generativa per l’audio

Voice Design

Applicazioni

Ecosistema

Articoli simili

Aggiornamenti alle API Key

Babbo Natale esiste davvero e sta aspettando la tua chiamata

GenFM ora in riproduzione su ElevenReader

Studio è ancora più grande e potente