Come funziona lo sconto dell’80% su Eleven v3?

Eleven v3 è scontato dell’80% fino alla fine di giugno 2025 per gli utenti self-serve che lo usano tramite l’interfaccia.

Come sono stati generati i sample nel video e sul sito?

Sono stati generati solo con il modello Eleven v3.

Come funziona la generazione di dialoghi?

Text to Dialogue intreccia più voci per creare un’interazione fluida tra di loro. Abbinando prosodia, gamma emotiva e seguendo i tag audio, Text to Dialogue rappresenta un grande passo avanti nella generazione di conversazioni coinvolgenti.

È disponibile tramite API?

L’API pubblica per Eleven v3 (alpha) arriverà presto. Per l’accesso anticipato, contatta il team commerciale .

Quali tag audio sono supportati?

Eleven v3 supporta una vasta gamma di tag audio, che dipendono in parte dalla voce e dal contesto. Leggi la per maggiori informazioni.

Quali lingue sono supportate?

Afrikaans (afr), Arabo (ara), Armeno (hye), Assamese (asm), Azero (aze), Bielorusso (bel), Bengalese (ben), Bosniaco (bos), Bulgaro (bul), Catalano (cat), Cebuano (ceb), Chichewa (nya), Croato (hrv), Ceco (ces), Danese (dan), Olandese (nld), Inglese (eng), Estone (est), Filippino (fil), Finlandese (fin), Francese (fra), Galiziano (glg), Georgiano (kat), Tedesco (deu), Greco (ell), Gujarati (guj), Hausa (hau), Ebraico (heb), Hindi (hin), Ungherese (hun), Islandese (isl), Indonesiano (ind), Irlandese (gle), Italiano (ita), Giapponese (jpn), Giavanese (jav), Kannada (kan), Kazako (kaz), Kirghiso (kir), Coreano (kor), Lettone (lav), Lingala (lin), Lituano (lit), Lussemburghese (ltz), Macedone (mkd), Malese (msa), Malayalam (mal), Cinese mandarino (cmn), Marathi (mar), Nepalese (nep), Norvegese (nor), Pashtu (pus), Persiano (fas), Polacco (pol), Portoghese (por), Punjabi (pan), Rumeno (ron), Russo (rus), Serbo (srp), Sindhi (snd), Slovacco (slk), Sloveno (slv), Somalo (som), Spagnolo (spa), Swahili (swa), Svedese (swe), Tamil (tam), Telugu (tel), Thai (tha), Turco (tur), Ucraino (ukr), Urdu (urd), Vietnamita (vie), Gallese (cym)

Presentiamo Eleven v3 (alpha)

Scritto da: Piotr Dabkowski; Mati Staniszewski
Pubblicato: 3 giu 2025

AscoltaAscolta questo articolo

0:00

0:000:00

Contatta il team commerciale

Scopri di più

Eleven v3 is no longer in alpha, and is now generally available.

Siamo felici di presentare Eleven v3 (alpha) — il modello Text to Speech più espressivo.

Questa anteprima di ricerca offre un controllo e un realismo senza precedenti nella generazione vocale grazie a:

Oltre 70 lingue
Dialogo multi-speaker
Tag audio come [excited], [whispers] e [sighs]

Eleven v3 (alpha) richiede più prompt engineering rispetto ai modelli precedenti — ma i risultati sono sorprendenti.

Se lavori su video,

Eleven v3 è disponibile da oggi sul nostro sito e tramite API.

Perché abbiamo creato v3

Dopo il lancio di Multilingual v2, abbiamo visto la voce IA adottata in film professionali, sviluppo di videogiochi, istruzione e accessibilità. Ma il limite principale non era la qualità audio — era l’espressività. Emozioni più marcate, interruzioni conversazionali e scambi credibili erano difficili da ottenere.

Eleven v3 colma questa lacuna. È stato progettato da zero per offrire voci che sospirano, sussurrano, ridono e reagiscono — generando parlato che sembra davvero vivo e reattivo.

Novità di Eleven v3 (alpha)

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Come usare i tag audio

I tag audio si inseriscono direttamente nello script e sono scritti tra parentesi quadre minuscole. Puoi scoprire di più sui tag audio nella nostra guida al prompting per v3 nella documentazione.

Le Clonazioni Vocali Professionali (PVC) al momento non sono completamente ottimizzate per Eleven v3, quindi la qualità delle clonazioni potrebbe essere inferiore rispetto ai modelli precedenti. In questa fase di anteprima di ricerca, ti consigliamo di trovare una

Ad esempio, puoi scrivere: “[whispers] Sta arrivando qualcosa… [sighs] Lo sento.” Oppure, per un controllo ancora più espressivo, puoi combinare più tag:

“[happily][shouts] We did it! [laughs].”

Creare dialoghi multi-speaker

Eleven v3 è supportato nel nostro endpoint Text to Speech attuale. Inoltre, introduciamo un nuovo endpoint API Text to Dialogue. Fornisci un array strutturato di oggetti JSON — ognuno rappresenta un turno di parlata — e il modello genera un file audio coeso e sovrapposto:

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

L’endpoint gestisce automaticamente i cambi di speaker, le variazioni emotive e le interruzioni.

Scopri di più qui.

v3 is our most expressive model

Prezzi e disponibilità

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Per attivare v3:

Usa il Selettore modello e seleziona Eleven v3 (alpha)

L’accesso API e il supporto in Studio arriveranno presto. Per l’accesso anticipato, contatta il team commerciale.

Quando non usare v3

Eleven v3 (alpha) richiede più prompt engineering rispetto ai nostri modelli precedenti. Quando funziona, il risultato è sorprendente, ma l’affidabilità e la latenza più alta lo rendono inadatto a casi d’uso in tempo reale o conversazionali. Per questi, ti consigliamo Eleven v2.5 Turbo/Flash.

Per maggiori dettagli, consulta la documentazione completa di v3 e le FAQ.

Try it today

Accedi all’interfaccia ElevenLabs
Seleziona v3 (alpha) dal menu dei modelli
Incolla il tuo script — usa tag o dialoghi
Genera audio

Non vediamo l’ora di scoprire come userai v3 in nuovi casi d’uso — dalla narrazione immersiva alle pipeline di produzione cinematografica.

Presentiamo Eleven v3 (alpha)

Perché abbiamo creato v3

Novità di Eleven v3 (alpha)

Hear v3 for yourself

Come usare i tag audio

Creare dialoghi multi-speaker

v3 is our most expressive model

Prezzi e disponibilità

Quando non usare v3

Try it today

Articoli simili

La prima IA che sa ridere

Conversione Vocale

Presentiamo Dubbing v2

Presentiamo Music v2