.webp&w=3840&q=80)
Vibe Drawの構築: ElevenLabsとFLUX Kontextを組み合わせた音声駆動の画像作成
- カテゴリ
- デベロッパー
- 日付
ElevenLabs Agent Skills(エージェントスキル)を新たにご紹介します。ElevenLabsでより素早く構築できるようになるスキルのコレクションです。
本日、構築をサポートする6つのスキルを公開します:
APIキーの設定ElevenLabs MCPツールで使うためのElevenLabs APIキーの設定手順を案内します。ユーザーがElevenLabs APIキーの設定が必要な場合や、APIキーが未設定でElevenLabsツールが動作しない場合、またはElevenLabsへのアクセスが必要とユーザーが言及した際にご利用ください。
エージェントElevenLabsで音声AIエージェントを構築できます。音声アシスタントやカスタマーサービスボット、インタラクティブな音声キャラクター、リアルタイム音声会話体験を作成する際にご利用ください。
スピーチtoテキストElevenLabs Scribe v2を使って音声をテキストに書き起こします。音声やビデオをテキスト化したい時、字幕の生成、会議の文字起こし、話し言葉の処理などにご利用ください。
テキスト読み上げElevenLabsの音声AIでテキストを音声に変換します。テキストから音声を生成したい時、ボイスオーバーの作成、音声アプリの開発、70以上の言語で音声合成したい場合にご利用ください。
音楽ElevenLabs Music APIで音楽を生成します。インストゥルメンタル、歌詞付きの楽曲、BGM、ジングル、AI生成の音楽制作などにご利用ください。プロンプトによる生成、細かなコントロールができる作曲プラン、メタデータ付きの詳細な出力に対応しています。
サウンドエフェクトElevenLabsでテキスト説明からサウンドエフェクトを生成します。サウンドエフェクトやオーディオテクスチャ、環境音、シネマティックな効果音、UIサウンドなど、音声以外のオーディオ制作にご利用ください。ループ再生、長さの調整、プロンプトによる細かな調整も可能です。
スキルは、LLM向けに最適化されたドキュメントとして機能するMarkdownファイルを含むフォルダです。利用するには、ご自身が使うコーディングエージェントに合わせて、各スキルを正しいフォルダにインストールする必要があります。例えば、Claude Codeではスキルを.claude/skills フォルダに保存し、Cursorsでは.cursors/skills フォルダに保存します。
最も簡単な方法は、オープンソースのスキルディレクトリを使い、次のコマンドを実行することです:
npx skills add elevenlabs/skills
このコマンドを実行するとセットアップフローが始まり、スキルが正しい場所にコピーされます。また、スキルはGitHubリポジトリ.
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)