Salta al contenuto

Come abbiamo creato una soundboard con la SFX API di ElevenLabs

Scopri come ElevenLabs ha creato SB1, una soundboard infinita alimentata dal nostro modello audio IA text-to-sound effects, che ti permette di generare qualsiasi suono su richiesta.

SB1

Immagina una soundboard che può generare suoni illimitati su richiesta. È proprio quello che abbiamo creato in ElevenLabs — ecco SB1, la nostra soundboard infinita. In apparenza sembra una classica griglia di pad che attivi con click o scorciatoie da tastiera. Ma sotto la superficie, è alimentata dal nostro modello audio IA di testo in effetti sonori.

Per usarla ti basta descrivere qualsiasi suono ti venga in mente e SB1 lo genera per te. Ci sono anche alcuni suoni predefiniti, ma puoi sostituirli quando vuoi.

Dall’idea al prototipo

Siamo partiti da una domanda semplice: e se potessi scrivere una descrizione, come “suoni ambientali soffusi di una foresta” o “sospiro drammatico del pubblico”, e ottenere subito un effetto sonoro pronto all’uso?

Le soundboard tradizionali si basano su librerie MP3 statiche che devi cercare online. Anche quando trovi un suono adatto, spesso non è ‘esattamente’ quello che volevi. Con l’IA generativa, questo problema non esiste più. Non hai più limiti.

SB1 Prototype

Prima di passare al codice ci siamo rivolti a Adorabile per creare una versione prototipo di base di quella che sarebbe diventata SB1. Non era ancora collegata all’API, ma ci ha permesso di sperimentare con il design e la disposizione dei pulsanti, prima che il nostro team realizzasse la UI e il codice finale.

Volevamo contenuti dinamici — qualsiasi suono, generato al volo. Il cuore della nostra soluzione è la SFX API di ElevenLabs. L’API risponde da un unico endpoint:

POST https://api.elevenlabs.io/v1/sound-generation

Invii un payload JSON con il tuo prompt, il numero di variazioni desiderate (di default sono quattro) e la tua API key nell’header Authorization.

La risposta restituisce un array di URL che puntano ai file WAV generati. Da lì puoi ascoltarli in streaming, scaricarli e assegnare ogni clip a un pad. Puoi anche attivare il loop. Usa prompt descrittivi per ottenere risultati più dettagliati.

Key API details

  • Headers:
    • Authorization: Bearer YOUR_API_KEY
    • Content-Type: application/json
  • Body parameters:
    • prompt (string): description of the sound
    • n (integer): number of variations (1–10)
    • format (string, optional): wav or mp3 (defaults to wav)

Una richiesta di esempio è così:

{
  "prompt": "rain hitting the roof of a tent",
  "n": 4,
  "format": "wav"
}

Riceverai un array di quattro URL. Abbiamo progettato l’API per adattarsi a qualsiasi esigenza — dalla creazione di soundboard su misura alla generazione massiva di asset audio per videogiochi.

Come abbiamo costruito l’interfaccia di SB1

Con l’API pronta, ci siamo dedicati al front-end. SB1 è una web app realizzata con React e Tailwind CSS. Ogni pad ha due modalità:

  1. Preset: carica da un set salvato di URL audio
  2. Personalizzata: generata dall’utente tramite la SFX API

Quando clicchi su un pad vuoto in modalità personalizzata, si apre una finestra di dialogo. Scrivi la tua descrizione, premi Genera e l’API ti restituisce quattro opzioni. Puoi ascoltarle subito, scegliere la tua preferita e il pad si aggiorna all’istante. Puoi anche assegnare tasti della tastiera per attivare i pad e suonare ritmi o effetti dal vivo.

Abbiamo aggiunto anche i controlli per il loop. Ti basta premere il pulsante loop, toccare il suono che vuoi ripetere e continuerà a suonare finché non lo rilasci. Così SB1 è utile non solo per scherzi — pensa a drum machine e atmosfere ambientali — ma anche per podcast, effetti sonori in live streaming e meditazioni guidate.

Esempi pratici

Paesaggio sonoro ambient

  • Pioggia leggera: "pioggia leggera che cade sulle foglie"
 / 
  • Pioggia intensa: "pioggia forte su un tetto di lamiera"
 / 
  • Onde del mare: onde morbide che si infrangono sulla riva
 / 

Abbiamo generato questi suoni inviando prompt come “pioggia leggera che cade sulle foglie” e “onde morbide che si infrangono sulla riva”. Poi abbiamo impostato i pad in loop, creando un sottofondo ideale per la concentrazione o la meditazione.

Drum machine

  • 808 kick: "808 kick molto profondo"
 / 
  • Colpo di rullante: "rullante secco e deciso"
 / 
  • Charleston aperto: "charleston aperto che risuona"
 / 

Non servono campioni audio da una drum library. Basta descrivere “808 kick molto profondo” o “rullante secco e deciso” e l’API ti dà quattro versioni da ascoltare. Li abbiamo assegnati ai tasti A, S e D per una demo dal vivo.

Se vuoi davvero mettere alla prova il modello, puoi usarlo anche per creare brevi frasi vocali con la voce di un personaggio. Basta specificare il personaggio e inserire le parole tra parentesi.

  • DJ carico: DJ carico che dice: "Facciamo partire la festa"
 / 
  • Orco in missione: Orco con voce roca che dice: "Questa stanza è oltre la capienza"
 / 
  • Canto della sirena: Voce femminile inquietante che canta: "È ora di andare a letto, la festa è finita"
 / 

Preset personalizzati

Puoi salvare e dare un nome ai tuoi preset — ad esempio, “Livestream FX” con sospiro, risata e applausi. Dopo aver creato la tua board, clicca su Condividi per copiare un link o pubblicare direttamente sui social. Chiunque abbia il link può caricare la tua configurazione SB1 e ascoltare i suoni che hai scelto.

Cosa interessa agli sviluppatori

  • Generazione stateless: Ogni chiamata API è indipendente. Non serve gestire pipeline di training o archiviare grandi librerie di campioni — basta memorizzare in cache gli URL che usi nella UI.
  • Bassa latenza: Il tempo di generazione tipico è inferiore a due secondi, quindi la funzione sembra istantanea durante le demo.
  • Scalabile: Puoi generare centinaia di suoni in parallelo e poi salvarli nel tuo CDN per gestire grandi volumi di traffico.
  • Formati flessibili: WAV per la massima qualità, MP3 se ti servono file più leggeri.

Per iniziare, dai un’occhiata alla nostra documentazione. Trovi esempi di codice in JavaScript, Python e cURL che mostrano come integrare la SFX API nei tuoi progetti.

E ora?

SB1 è solo una delle demo di ciò che può fare il nostro modello per effetti sonori. Stiamo lavorando a plugin per OBS e digital audio workstation, così puoi generare nuovi suoni senza uscire dal tuo software di streaming o produzione. Inoltre stiamo ottimizzando il modello per migliorare le performance con prompt musicali — come percussioni esotiche o texture di synth.

Se crei qualcosa di interessante, vogliamo vederlo! Taggaci sui social o condividi il link del tuo preset. Che tu sia uno streamer, un podcaster, uno sviluppatore di videogiochi o semplicemente ami giocare con i suoni, SB1 e la SFX API ti danno creatività audio senza limiti.

Provalo gratis oggi stesso — non serve nessuna libreria MP3.

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità