
ElevenLabs è ora una Kiro Power
- Categoria
- ElevenAPI
- Data
La massima accuratezza STT per applicazioni su larga scala. Rileva enfasi ed effetti sonori e guida la trascrizione con suggerimenti di parole chiave.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Crea sottotitoli, trascrizioni modificabili e didascalie per podcast, video, interviste e altri contenuti registrati – tutto con la massima precisione tramite API.
Scribe v2 raggiunge una precisione di trascrizione leader nel settore, offrendo testo pulito e modificabile anche in condizioni audio difficili o con accenti diversi.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Trascrizione che funziona anche in ambienti rumorosi, con musica di sottofondo, accenti marcati e audio di bassa qualità.
L’API di Trascrizione ElevenLabs rileva risate, emozioni ed effetti sonori. Usa i suggerimenti di termini chiave per guidare la trascrizione con termini specifici del tuo settore.
.webp&w=3840&q=95)
.webp&w=3840&q=95)

Rileva eventi non vocali come risate, applausi, musica e rumori di fondo. Le trascrizioni includono tutto il contesto audio, non solo le parole.
Riconosce e assegna automaticamente fino a 48 speaker. Attribuzione chiara di chi ha detto cosa, organizzata in trascrizioni leggibili.
Riconosce e tagga automaticamente 56 tipi di entità, tra cui nomi, date, luoghi e organizzazioni all’interno delle trascrizioni.

Massima precisione, pensato per grandi volumi.

Minima latenza, per esigenze in tempo reale.
Precisione eccezionale su accenti, dialetti e condizioni di registrazione diverse.
Cambia il languageCode per vedere l’anteprima delle lingue
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // Imposta lingua
diarize: true
});
console.log(transcription);“Dalla localizzazione dei Reels nelle lingue locali, alla generazione di musica e voci di personaggi in Horizon, la piattaforma ElevenLabs permette a creator, aziende e imprese di tutto il mondo di creare con voce, musica e suono su larga scala.”
“La precisione di Scribe su così tante lingue permette a Fieldy di comprendere ogni conversazione quotidiana e di espandersi facilmente in tutto il mondo. Dopo il passaggio a ElevenLabs Scribe, Fieldy ha aumentato la retention degli utenti del 50%.”
“ElevenLabs ci ha permesso di integrare rapidamente funzionalità avanzate di text-to-speech nel nostro SDK, così gli Agent possono rispondere in tempo reale con voci espressive alle domande degli utenti o come feedback a ciò che vedono.”

“Twilio ha integrato la tecnologia di generazione vocale IA di ElevenLabs nel suo CPaaS, migliorando ConversationRelay. Questa integrazione consente a aziende e sviluppatori di creare interazioni vocali IA conversazionali che suonano naturali, sono espressive e rispondono in tempo reale direttamente dalla piattaforma Twilio CPaaS. Noi di ElevenLabs siamo entusiasti che Twilio abbia scelto ElevenLabs per rendere ConversationRelay ancora più espressivo e naturale.”








.webp&w=3840&q=80)
