Ulepszenia WebSocket: niezawodność i niestandardowy limit czasu

Bardziej stabilne wyjście dla długich generacji dźwięku i niestandardowy limit czasu bezczynności

Wprowadziliśmy aktualizacje do naszego interfejsu API WebSocket, dzięki którym długie generacje audio są bardziej stabilne. Zmiany te rozwiązują problemy, w wyniku których głosy stawały się mechaniczne lub zanikały podczas dłuższych sesji, zapewniając spójną jakość w całym tekście. Poniżej pokazaliśmy, jak zmienia się głos na początku i na końcu długiego pokolenia:

Zanim

 / 
 / 

Po

 / 
 / 

Dodaliśmy również niestandardowy limit czasu bezczynności dla połączeń WebSocket, wynoszący maksymalnie 180 sekund. Domyślny czas to 20 sekund, ale można go wydłużyć, aby lepiej odpowiadał Twoim potrzebom.

Aby to zmienić, wystarczy dodać inactivity_timeout jako parametr zapytania w punkcie końcowym WebSocket:

wss://api.elevenlabs.io/v1/text-to-speech/{voice_id}/stream-input?model_id=eleven_turbo_v2&inactivity_timeout=180

Zobacz więcej

ElevenLabs

Twórz z najwyższą jakością dźwięku AI