
Pair Team builds AI care manager with ElevenLabs Agents Platform
Increasing access to healthcare for underserved communities through safe, autonomous voice agents with 99.9% success rate
Eleven v3, nasz najbardziej zaawansowany model Text to Speech, wyszedł z Alphy i jest już dostępny dla wszystkich.
Eleven v3, nasz najbardziej zaawansowany model Text to Speech, wyszedł z Alphy i jest już dostępny dla wszystkich.
Od premiery Alphy cały czas ulepszaliśmy model. Najważniejsze zmiany:
Stabilniejszy. W testach użytkownicy wybierali nową wersję w 72% przypadków zamiast poprzedniej Alphy.
Dokładniejszy. Znacznie poprawiliśmy rozpoznawanie liczb, symboli i specjalnych oznaczeń w różnych językach.
Modele Text to Speech muszą zrozumieć, co piszesz, i zdecydować, jak to wypowiedzieć. Te same symbole mogą znaczyć coś innego w różnych kontekstach.
Na przykład numer telefonu: "+49 170 9876543"
Czasem nasze modele czytały to jako "plus czterdzieści dziewięć, sto siedemdziesiąt, dziewięć milionów osiemset siedemdziesiąt sześć tysięcy pięćset czterdzieści trzy" – traktując cyfry jak duże liczby zamiast ciągu cyfr. Poprawne odczytanie to "plus cztery dziewięć, jeden siedem zero, dziewięć osiem siedem sześć pięć cztery trzy."
Takie błędy pojawiały się w różnych kategoriach – wyniki sportowe, wzory chemiczne, waluty, współrzędne – wszędzie tam, gdzie model musiał zinterpretować symbole i zdecydować, jak je przeczytać.
Testowaliśmy na naszym wewnętrznym benchmarku obejmującym 27 kategorii w 8 językach.
Podsumowanie: 68% mniej błędów. Liczba błędów spadła z 15,3% do 4,9%.
Błędy według kategorii:
Największa poprawa jest tam, gdzie kontekst decyduje o znaczeniu – na przykład dwukropek może oznaczać wynik meczu, godzinę albo proporcje, w zależności od tekstu.
Przykłady
Waluty — poprawna wartość:
Wpis: ¥250,000
Przed: 25 000 jenów
Po: 250 000 jenów
Wzory chemiczne — symbole zachowane poprawnie:
Wpis: SO₂
Przed: "siarka podwójna" (zniekształcone)
Po: "S O dwa"
Wyniki sportowe — interpretacja zależna od kontekstu:
Wpis: Wynik końcowy: 102-98
Przed: "sto dwa minus dziewięćdziesiąt osiem"
Po: "sto dwa do dziewięćdziesięciu ośmiu"
Eleven v3 jest już dostępny na wszystkich platformach.

Increasing access to healthcare for underserved communities through safe, autonomous voice agents with 99.9% success rate

Demonstrating how AI is reshaping communication and connection.