Perplexity
TEXT TO SPEECH(テキスト読み上げ)
まるで本物の人間のような声を生成する高品質なAIボイスジェネレーター
サンプルを試す
フルオーディオAIプラットフォームを体験
Meet Eleven v3 — our most expressive Text to Speech model
Experience dynamic conversations, emotional nuance, and rich delivery like never before. With Eleven v3, you can: - Direct tone and timing using in-line audio tags - Generate natural dialogue between multiple speakers - Localize at scale with human-like speech in 70+ languages From stadium chants to comedic timing, expressive storytelling to chaotic group banter — v3 makes voice creation fully controllable, deeply human, and unmistakably real.
感情とコンテキストを考慮したAIボイス
音声AIは、テキストの感情的な手がかりに反応します。広範な文脈を踏まえて、各コンテンツを適切なかたちで提供します。AIボイスは、コンテンツを読み上げるときに、豊かな感情を表現し、かつ論理的な誤りを避けることができます。
スタジオ品質のビデオボイスオーバー
声を選び、スクリプトをアップロードして、ソーシャルメディア、コマーシャル、映画などの高品質なボイスオーバーを生成。タイミングを調整し、複数の話者を割り当て、ボイスオーバースタジオでサウンドエフェクトを追加できます。
人間らしいAIボイスオーバーの作り方
テキスト読み上げジェネレーターの使い方を学び、Eleven Multilingual v2やEleven v3 (alpha)などのモデルを選択し、ダイアログタグでオーディオを微調整する方法を発見。ボイスデザインツールを使ってカスタムボイスを作成し、作品をダウンロードして共有する方法も学べます。
多言語スピーチ合成
すべてのAI音声は70以上の言語を話せます。多言語対応のテキスト読み上げモデルを使って、国際的なオーディエンスとつながり、言語の壁を越え、新しい市場での機会を開拓しましょう
モデル概要
Multilingual v2 (TTS)
29言語に対応した、最もリアルで感情豊かなテキスト読み上げモデル。ボイスオーバー、オーディオブック、ポストプロダクション、コンテンツ制作に最適
Flash v2 (TTS)
英語専用の低遅延TTSモデル。スピードが重要なデベロッパーや単一言語のユースケースに最適。Turbo v2.5と同等のパフォーマンス
Flash v2.5 (TTS)
70以上の言語に対応した高品質・低遅延のTTSモデル。スピードが重要で非英語の言語が必要なデベロッパー向け
ユースケース
ビデオボイスオーバー
AIテキスト読み上げを使用して、ビデオ、テレビ番組、アニメーションの高品質なボイスオーバーを制作。人間のボイスアクターが不要で、制作を迅速化。
ポッドキャスト
AIテキスト読み上げを使用して、プロフェッショナルなナレーションのポッドキャストを作成し、手動録音の時間を短縮。
アクセシビリティ
ウェブサイトやアプリにテキスト読み上げを統合し、視覚障害者や読書困難なユーザーが情報にアクセスしやすくするための音声版コンテンツを提供。