Przedstawiamy Eleven v3 Alpha

Wypróbuj v3

Czym są tagi audio Eleven v3 — i dlaczego są ważne

Tagi audio ElevenLabs kontrolują emocje głosu AI, tempo i efekty dźwiękowe.

Audio tags

Wraz z wydaniem Eleven v3, podpowiadanie audio stało się niezbędną umiejętnością. Zamiast wpisywać lub wklejać słowa, które ma wypowiedzieć głos AI, możesz teraz użyć nowej funkcji — Tagi Audio — aby kontrolować wszystko, od emocji po sposób dostarczania.

Eleven v3 to wersja alfa podgląd badawczy nowego modelu. Wymaga więcej projektowania podpowiedzi niż poprzednie modele — ale efekty są oszałamiające.

Tagi Audio ElevenLabs to słowa w nawiasach kwadratowych, które nowy model Eleven v3 może interpretować i używać do kierowania akcją dźwiękową. Mogą to być [podekscytowany], [szept], [westchnienie] aż po [strzał], [oklaski] i [eksplozja].

Tagi Audio pozwalają kształtować brzmienie głosów AI, w tym niewerbalne sygnały jak ton, pauzy i tempo. Niezależnie od tego, czy tworzysz wciągające audiobooki, interaktywne postacie, czy media oparte na dialogach, te proste narzędzia na poziomie skryptu dają precyzyjną kontrolę nad emocjami i sposobem dostarczania.

Reżyserowanie występu za pomocą Tagów Audio

Możesz umieszczać Tagi Audio w dowolnym miejscu w skrypcie, aby kształtować sposób dostarczania w czasie rzeczywistym. Możesz także używać kombinacji tagów w skrypcie lub nawet w zdaniu. Tagi dzielą się na główne kategorie:

Emocje

Te tagi pomagają ustawić emocjonalny ton głosu — czy to poważny, intensywny, czy radosny. Na przykład możesz użyć jednego lub kombinacji [smutny], [zły], [radosny] i [żałobny].

Background
sorrowful I couldn't sleep that night. The air was too still, and the moonlight kept sliding through the blinds like it was trying to tell me something. quietly And suddenly, that's when I saw it.
Background
Okay, you are not going to believe this. You know how I've been totally stuck on that short story, like staring at the screen for HOURS, just... nothing? sigh I was seriously about to just trash the whole thing - start over - give up probably, but then laughs last night I was just doodling, not even thinking about it, right? And this one little phrase popped into my head, just completely out of the blue, and it wasn't even for the story initially. But then I typed it out just to see, and it was like the FLOODGATES opened. Suddenly I knew exactly where the character needed to go, what the ending had to be. It all just - clicked. sigh I stayed up till like 3:00 AM, just typing like a maniac, didn't even stop for coffee. light chuckle And it's, it's GOOD, like really good. It feels so complete now, you know, like it finally has a soul. I am so incredibly pumped to finish editing it now. It went from feeling like a chore to feeling like MAGIC. Seriously, I'm still buzzing.

Kierunek dostarczania

Chodzi bardziej o ton i wykonanie. Możesz używać tych tagów do regulacji głośności i energii w scenach wymagających powściągliwości lub siły. Przykłady to: [szept], [krzyk] a nawet [x akcent].

Background
Could you switch my accent in the old model? dismissive didn't think so. cheeky but you can now! so, Check this out...In just a sec, I'm gonna to speak with a different accent.. and just between you and me whispers I don't really know how. chuckles but ok.. first let's change it up... Australian accent so that I can fit in with the locals in Melbourne when I visit next month! laughs hard Woooo! yeah man, this - is - sick. Ok, let's try a different one - see if you can guess... strong French accent My love... eez like a red, red rose..
Background
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

Reakcje ludzkie

Prawdziwa naturalna mowa zawiera reakcje. Możesz użyć tego, aby dodać realizmu, wprowadzając naturalne, nieskryptowane momenty do mowy. Na przykład: [śmiech], [chrząknięcie] i [westchnienie].

Background
We're off under the lights here for this semi-final clash, the stadium buzzing with anticipation. ElevenLabs United in their iconic black and white shirts, pushing forward with intent straight from the opening whistle. excited The ball is zipped out wide, early attack here. Driving down the wing, pace to Bernie, shouting skips past one, skips past two! Oh, this is beautiful. One-on-one with the full-back, cuts inside—oh, that's a lovely bit of footwork!!! PURE MAGIC on the pitch! ElevenLabs on top form tonight!
Background
Oh my God. laughs You guys, like no joke, I just tried this TTS thing and it was, like, weirdly emotional. Like it literally said, "Hi," and I was, like, on the verge of tears. laughs I don't even cry, okay? I'm a Capricorn.

Zbudowane na bardziej ekspresyjnym modelu

Podstawą tych funkcji jest nowa architektura v3. Model rozumie kontekst tekstu na głębszym poziomie, co oznacza, że może naturalniej podążać za emocjonalnymi wskazówkami, zmianami tonu i przejściami między mówcami. W połączeniu z Tagami Audio, to odblokowuje większą ekspresję niż było to wcześniej możliwe w TTS.

Możesz teraz także tworzyć dialogi wieloosobowe które wydają się spontaniczne — obsługując przerwania, zmiany nastroju i niuanse konwersacyjne przy minimalnym podpowiadaniu.

Dostępne teraz

Profesjonalne Klony Głosowe (PVC) nie są jeszcze w pełni zoptymalizowane dla Eleven v3, co może skutkować niższą jakością klonów w porównaniu do wcześniejszych modeli. W tej fazie podglądu badawczego najlepiej znaleźć Instant Voice Clone (IVC) lub zaprojektowany głos do projektu, jeśli potrzebujesz funkcji v3. Optymalizacja PVC dla v3 pojawi się wkrótce.80% off until the end of June. Public API for Eleven v3 (alpha) is coming soon. For early access, please contact sales. Whether you’re experimenting or deploying at scale, now’s the time to explore what’s possible.

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI