Przedstawiamy Scribe v2

Dziś wprowadzamy Scribe v2: najdokładniejszy model transkrypcji, obsługujący ponad 90 języków.

Introducing Scribe v2

Scribe v2 jest stworzony do masowej transkrypcji, tworzenia napisów i podpisów. Poprawia stabilność i dokładność Scribe v1, lepiej radząc sobie z długimi nagraniami, pauzami, zmianami tonu i długimi przerwami.

Introducing Scribe v2

Podczas gdy Scribe v2 Realtime jest zoptymalizowany pod kątem ultra niskiej latencji i zastosowań agentów, Scribe v2 jest zoptymalizowany do długich i złożonych nagrań, utrzymując dokładność wśród różnych mówców, akcentów i stylów wypowiedzi. Efektem są niezawodne transkrypcje w różnych rzeczywistych warunkach audio.


Scribe v2 osiąga najniższy wskaźnik błędów słów na standardowych benchmarkach branżowych.

Scribe v2 FLEURS benchmark

Keyterm Prompting dla transkrypcji kontekstowej

Keyterm prompting wykracza poza standardowe Custom Vocabulary, wykorzystując kontekst transkrypcji. Wybierz do 100 słów lub fraz, a Scribe v2 dokładnie zdecyduje, kiedy je transkrybować. To idealne rozwiązanie dla dziedzin technicznych, nazw marek i języka branżowego.

Scribe v2 keyterm prompting

Wbudowane wykrywanie jednostek z precyzyjnymi znacznikami czasu

Scribe v2 zawiera natywne wykrywanie jednostek do analizy strukturalnej audio.

Możesz wybrać do 56 kategorii w zakresie danych osobowych, danych zdrowotnych lub szczegółów płatności. Scribe v2 automatycznie wykryje te przypadki i ich dokładne znaczniki czasu w transkrypcji, ułatwiając przeglądanie, redagowanie lub przetwarzanie wrażliwych informacji na dużą skalę.

Dowiedz się więcej w dokumentacji API: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Automatyczna transkrypcja wielojęzyczna

Scribe v2 obsługuje inteligentne wielojęzyczne workflow od razu po uruchomieniu.

Możesz przesłać audio zawierające wiele języków w jednym pliku. Model automatycznie wykrywa każdy język i transkrybuje go poprawnie bez ręcznego segmentowania czy konfiguracji.

Dodatkowe funkcje dla workflow produkcyjnych

Scribe v2 zawiera zestaw funkcji zaprojektowanych dla przedsiębiorstw i deweloperów:

  • Inteligentna diarizacja mówców dla jasnego, intuicyjnego oznaczania mówców
  • Precyzyjne znaczniki czasu na poziomie słów dla dokładnego dopasowania napisów i interaktywnych doświadczeń
  • Dynamiczne tagowanie audio wykrywające zdarzenia niebędące mową, takie jak śmiech czy kroki
  • Gotowość dla przedsiębiorstw z zgodnością SOC 2, ISO 27001, PCI DSS L1, HIPAA i RODO, rezydencja danych w UE i Indiach oraz wsparcie trybu zerowej retencji

Scribe v2, teraz w ElevenLabs Studio

Scribe v2 jest teraz używany w ElevenLabs Studio dla dokładniejszych napisów, podpisów i transkrypcji, wspierając zespoły zarządzające dużymi bibliotekami audio i wideo w marketingu, mediach, badaniach, szkoleniach i zgodności.

Scribe v2 in Studio

Wypróbuj teraz: https://elevenlabs.io/app/studio

Buduj z API

Dzięki Scribe v2 deweloperzy i przedsiębiorstwa mogą automatyzować złożone procesy audio, poprawiać dokładność w globalnych workflow treści i skalować bezpiecznie z pełną zgodnością i kontrolą rezydencji danych.

Scribe v2 Keyterm prompting code snippet

Scribe v2 jest dostępny już dziś przez nasze API i platformę Creative.

Wypróbuj teraz: https://elevenlabs.io/app/speech-to-text

Przeczytaj dokumentację: https://elevenlabs.io/docs/capabilities/speech-to-text

Zarejestruj się tutaj: https://elevenlabs.io/speech-to-text

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI