
Funding Societies scales outreach across Southeast Asia with ElevenLabs’ Conversational AI
Automating 1,000+ outbound calls with custom multilingual voice agents.
Eleven v3 アルファのご紹介
v3を試すElevenLabsがどのようにして、テキストからサウンドエフェクトを生成するAIオーディオモデルを活用し、無限のサウンドボードSB1を作成したかを学びましょう。ユーザーは任意のサウンドをオンデマンドで生成できます。
無限に音を生成できるサウンドボードを想像してください。それがElevenLabsで開発したSB1です。こちらが無限サウンドボードです。見た目はクリックやキーボードショートカットで操作する一般的なパッドのグリッドですが、内部ではテキスト to サウンドエフェクトAIオーディオモデルで動作しています。
使い方は簡単で、思いつく音を説明するだけでSB1が生成します。あらかじめ定義されたデフォルトの音もありますが、それらも置き換えることができます。
コードに飛び込む前に、愛されるを使って、SB1になる基本的なプロトタイプバージョンを作成しました。まだAPIに接続されていませんが、デザインの選択やボタンの配置を実験する機会を得ました。その後、優秀なチームが最終的なUIとコードを作成しました。
動的なコンテンツを求めていました—その場で生成される任意のサウンド。私たちのソリューションの核はElevenLabs SFX APIです。このAPIは単一のエンドポイントの背後にあります:
1 | POST https://api.elevenlabs.io/v1/sound-generation |
プロンプト、必要なバリエーションの数(デフォルトは4)、APIキーをAuthorizationヘッダーに含めたJSONペイロードを送信します。
レスポンスは生成されたWAVファイルのURL配列を返します。そこからストリーミングやダウンロードを行い、各クリップをパッドに割り当てることができます。ループ設定も可能です。詳細なプロンプトを使用して、より具体的なサウンドを生成してください。
/v1/sound-effects/generate
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
prompt
(string): サウンドの説明n
(integer): バリエーションの数 (1–10)format
(string, optional): wav または mp3 (デフォルトは wav)サンプルリクエストは次のようになります:
1 | { |
2 | "prompt": "rain hitting the roof of a tent", |
3 | "n": 4, |
4 | "format": "wav" |
5 | } |
6 |
そして、4つのURLの配列が返されます。APIはあらゆるユースケースにスケールするように設計されています—即席のサウンドボード作成からゲームアセットの大量生成まで。
APIが整ったところで、フロントエンドに取り掛かりました。SB1はReactとTailwind CSSで構築されたウェブアプリです。各パッドコンポーネントには2つのモードがあります:
カスタムモードで空のパッドをクリックすると、プロンプトダイアログが表示されます。説明を入力し、生成を押すと、APIが4つのオプションを返します。それらをインラインで試聴し、お気に入りを選んでパッドが即座に更新されます。キーボードバインディングを使ってキーを押してパッドをトリガーし、リズムやサウンドキューをライブで再生できます。
ループコントロールも追加しました。ループボタンを押し、ループしたいサウンドをタップすると、解除するまで再生され続けます。これにより、SB1はジョークだけでなく、ドラムマシンやアンビエントな雰囲気、ポッドキャスト、ライブストリームのサウンドキュー、ガイド付き瞑想にも役立ちます。
「葉に滴る小雨」や「岸に打ち寄せる柔らかな波」といったプロンプトを送信して生成しました。それらのパッドをループ設定にし、集中や瞑想の背景を作り出しました。
ドラムライブラリからオーディオサンプルを取得する必要はありません。「超低音の808キック」や「タイトなスネアスナップ」と説明するだけで、APIが4つのバージョンを提供します。それらをA、S、Dキーにマッピングして、ライブパフォーマンスデモを行いました。
モデルを本当に試したい場合は、キャラクターの声で短いボイススニペットを作成することもできます。キャラクターを指定し、括弧内に言葉を入れるだけです。
自分のプリセットを保存して名前を付けることができます。例えば、「ライブストリームFX」として驚き、笑い、拍手を設定します。ボードを作成した後、共有をクリックしてリンクをコピーしたり、直接ソーシャルメディアに投稿したりできます。リンクを持っている人はあなたのSB1設定を読み込み、キュレーションされたサウンドを再生できます。
自分で始めるには、ドキュメントをチェックしてください。JavaScript、Python、cURLのコードサンプルがあり、SFX APIをプロジェクトに統合する方法を示しています。
SB1は、私たちのサウンドエフェクトモデルができることの一例に過ぎません。OBSやデジタルオーディオワークステーション用のプラグインを探求しており、ストリーミングや制作ソフトを離れることなく新しいサウンドを生成できるようにしています。また、音楽関連のプロンプトでのパフォーマンスを向上させるためにモデルを微調整しています—エキゾチックなパーカッションやシンセテクスチャを考えてみてください。
何か素晴らしいものを作ったら、ぜひ見せてください。ソーシャルメディアでタグ付けするか、プリセットリンクを共有してください。ストリーマー、ポッドキャスター、ゲームデベロッパー、またはサウンドを楽しむ人であれば、SB1とSFX APIは無限のオーディオクリエイティビティを提供します。
無料で試してみてください — MP3ライブラリは不要です。
Automating 1,000+ outbound calls with custom multilingual voice agents.
Start creating passive income from your voice today.