ブラックフライデー

引き換え

Scribe Realtime v2がライブ音声認識の新基準を設定

Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.

Scribe v2 Realtime

最速かつ最も正確なリアルタイム文字起こしシステム

Scribe v2 Realtimeは低遅延の新基準を設定します

ライブユースケース向けに設計—

Scribe v2 Realtime benchmark

デベロッパーはAPIに直接音声をストリーミングするか、ElevenLabs Agentsを通じて音声とエージェントのワークフローに迅速に統合できます。

[ビデオデモを挿入:文字起こしの遅延と精度を示す]

  • Negative latency: Next word and punctuation prediction
  • Automatic language detection: Speak in any language, switch language mid conversation
  • Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
  • Voice Activity Detection (VAD)
  • Manual commit: Full control over when to finalize transcript segments
  • Multiple audio formats: Support for PCM (48kHz) and  μ-law encoding
  • Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads

低遅延

音声からテキストへの変換を<XX ms未満で実行。

高精度

主要なストリーミングASRシステムを上回り、リアルタイムパフォーマンスの新基準を設定。完全に新しいアーキテクチャに基づいて構築され、Scribe v1で初めて導入された精度を拡張します。https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

スケーラブルな多言語サポート

Scribe Realtime v2は、地域の方言を含む92言語をサポートし、グローバルなアプリケーションへのアクセスを拡大します。

デベロッパー向け機能https://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[機能グリッドまたはアーキテクチャ図を挿入]

統合と利用可能性

Scribe Realtime v2は、ElevenLabs APIおよびElevenLabs Agentsで今日利用可能です。デベロッパーはシンプルなWebSocket接続を使用してライブ音声をストリーミングし、リアルタイムで文字起こしを受け取ることができます。https://elevenlabs.io/app/sign-up

ElevenLabsチームによる記事をもっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン