Question 1

Czym jest API ElevenLabs?

Accepted Answer

API ElevenLabs zapewnia programowy dostęp do naszych modeli AI dla głosu, muzyki, efektów dźwiękowych, dubbingu i transkrypcji. Możesz zintegrować te możliwości bezpośrednio w swoich aplikacjach, przepływach pracy i liniach produkcyjnych.

Question 2

Jakie API są dostępne?

Accepted Answer

Text to Speech - Generuj głos z tekstu
Speech to Text - Transkrybuj i diarizuj audio
Voice Library - Dostęp i klonowanie głosów
Dubbing - Tłumaczenie i lokalizacja audio w ponad 70 językach
Sound Effects - Generowanie niestandardowego audio
Music - Tworzenie utworów instrumentalnych i lirycznych
Voice Isolation - Usuwanie szumów tła

Question 3

Co mogę zbudować z API?

Accepted Answer

Typowe zastosowania obejmują lokalizację treści, automatyczną produkcję wideo, interfejsy konwersacyjne, narzędzia dostępności i generowanie treści szkoleniowych. API jest zaprojektowane zarówno do przetwarzania w czasie rzeczywistym, jak i batch.

Question 4

Jak działa uwierzytelnianie?

Accepted Answer

Wszystkie żądania API wymagają klucza API przekazywanego w nagłówku xi-api-key. Klucze są generowane w ustawieniach konta i mogą być przypisane do konkretnych przestrzeni roboczych.

Question 5

Jakie są limity użytkowania?

Accepted Answer

Limity użytkowania różnią się w zależności od planu i punktu końcowego. Użytkowanie PAYG jest dostępne od naszego planu Starter i wyżej.

Question 6

Czy oferujecie SDK?

Accepted Answer

Tak. Oficjalne SDK są dostępne dla Python i JavaScript/TypeScript oraz dodatkowe platformy jak Flutter, Swift i Kotlin dla naszej platformy Agents.

Question 7

Jak jest mierzone użytkowanie?

Accepted Answer

Text to Speech jest rozliczane za znak. Speech to Text jest rozliczane za minutę audio. Muzyka i efekty dźwiękowe są rozliczane za generację. Dubbing jest rozliczany za minutę źródłowego audio.

Question 8

Czy mogę używać niestandardowych głosów przez API?

Accepted Answer

Tak. Możesz odwołać się do dowolnego głosu w swojej bibliotece za pomocą ID, w tym głosów profesjonalnych, sklonowanych i zaprojektowanych przez ciebie.

Question 9

Czy treści API są bezpieczne do użytku komercyjnego?

Accepted Answer

Tak. Treści generowane przez API z użyciem modeli ElevenLabs są licencjonowane komercyjnie. Muzyka wymaga dodatkowej licencji na reklamy, filmy, TV, gry i dystrybucję korporacyjną.

Question 10

Jakie opóźnienie mogę się spodziewać?

Accepted Answer

Text to Speech zazwyczaj odpowiada w mniej niż 500ms dla streamingu. Speech to Text przetwarza w tempie 20-50x czasu rzeczywistego w zależności od rozmiaru pliku. Dubbing i Muzyka to operacje batch z czasem przetwarzania proporcjonalnym do długości treści.

Question 11

Czy wspieracie streaming?

Accepted Answer

Tak. Text to Speech i Speech to Text obsługują streaming output, co pozwala na użycie API w aplikacjach w czasie rzeczywistym.

Question 12

Jak obsługiwać błędy?

Accepted Answer

API zwraca standardowe kody statusu HTTP. Błędy limitu zwracają 429. Nieprawidłowe żądania zwracają 400 z szczegółami błędu. Błędy uwierzytelniania zwracają 401.

Question 13

Gdzie znajdę dokumentację API?

Accepted Answer

Kompletna dokumentacja API, przykłady kodu i przewodniki integracyjne są dostępne na elevenlabs.io/docs/api-reference

Question 14

Czy oferujecie wsparcie dla przedsiębiorstw?

Accepted Answer

Tak. Plany dla przedsiębiorstw obejmują dedykowane wsparcie, SLA, niestandardowe limity, SSO, zgodność z SOC 2 i MSA.

Twórz gotowe do produkcji AI audio w kilka minut

Twórz z pełnym zestawem API ElevenLabs

Generuj mowę

Transkrybuj mowę

Komponuj muzykę

Twórz efekty dźwiękowe

Twórz głosy

Wdrażaj agentów

Wspieramy wiodące firmy i marki na świecie

API gotowe do produkcji od pierwszego dnia

Ochrona danych na poziomie korporacyjnym

SDK dla Python i TypeScript

Podwyższone wsparcie i niestandardowe wdrożenia

Najczęściej zadawane pytania

Najnowsze aktualizacje