Budowanie ElevenAgents z Claude Code
- Opublikowano
- Ostatnia aktualizacja
PosłuchajPosłuchaj tego artykułu
Kiedyś do stworzenia agenta głosowego trzeba było sprintu i kilku dostawców. Teraz zbudujesz go od A do Z w jedno popołudnie z Claude Code. Ten przewodnik przeprowadzi cię przez cały proces: persona, baza wiedzy, workflow, narzędzia, zabezpieczenia, testy i numer telefonu, pod który możesz zadzwonić.
Co możesz zbudować w jedno popołudnie:
- Agent głosowy, który budzi cię i podaje podsumowanie nocnych błędów CI
- Wielojęzyczna infolinia do twojego projektu pobocznego jeszcze dziś
- Interaktywny agent na twoją stronę portfolio, który mówi jak ty
Ograniczenia, przez które agenci głosowi brzmieli sztucznie – opóźnienia, intonacja, zmiany w rozmowie – bardzo się poprawiły. Nasz najszybszy model działa z opóźnieniem ok. 75 ms i obsługuje pauzy oraz przerwy w czasie rzeczywistym. Eleven v3 to nasz najbardziej ekspresyjny model TTS – potrafi zmieniać ton, śmiać się i wzdychać jak człowiek.
Szybka konfiguracja
Najpierw zainstaluj ElevenLabs skill tym poleceniem w Claude Code:
Następnie uruchom skill setup-api-key, żeby podpiąć swój klucz ElevenLabs API:
Wskazówka: ustaw zakres klucza tylko na "agents-write" i limit dziennych wydatków. Błędna pętla może szybko zużyć środki.
Stwórz agenta
ElevenAgents pozwala ci uruchomić gotowego do pracy agenta głosowego w Claude Code w kilka minut, używając poleceń w języku naturalnym. Dalej znajdziesz kolejne polecenia – od pustego workspace do numeru telefonu, pod który można zadzwonić.
Zacznijmy od samego agenta. To pierwsze polecenie tworzy agenta z personą, głosem i LLM do rozumowania. Bez narzędzi, bazy wiedzy czy workflow – najszybsza droga od zera do działającego agenta.

Dodaj bazę wiedzy
Baza wiedzy to zestaw dokumentów, linków i FAQ, do których agent sięga, gdy ktoś o coś pyta. ElevenAgents obsługuje cały proces wyszukiwania (RAG). Gdy użytkownik pyta, platforma przeszukuje indeks, wybiera najtrafniejsze fragmenty i przekazuje je LLM jako kontekst do odpowiedzi. Źródła są automatycznie reindeksowane po zmianach, więc agent zawsze korzysta z aktualnych danych – nie musisz nic ponownie wrzucać.

Dodaj workflow
Jeden agent z jednym poleceniem dobrze radzi sobie z prostymi zadaniami. Workflow pozwala prowadzić rozmowy z wieloma intencjami. Zamiast upychać wszystko w jednym poleceniu, dzielisz agenta na węzły, z których każdy obsługuje konkretną intencję, a przejścia między nimi zależą od potrzeb rozmówcy. Każdy węzeł ma swoje zachowanie, a przejścia są oceniane przez LLM.

Dodaj narzędzia
ElevenAgents obsługuje trzy typy narzędzi, każde do czegoś innego. Narzędzia klienckie wykonują akcje w interfejsie, więc agent może np. nawigować, podświetlać lub zmieniać to, co widzi użytkownik. Webhooki wywołują twoje API, dzięki czemu agent czyta lub zapisuje dane w twoich systemach. Wbudowane narzędzia to typowe akcje platformy, których nie musisz sam budować, np. zakończenie rozmowy, wykrycie języka rozmówcy czy przekierowanie do człowieka.
.webp&w=3840&q=95)
Dodaj zabezpieczenia
Zabezpieczenia działają niezależnie od LLM, więc wychwytują przypadki, których nie przewidziałeś w poleceniu systemowym. Najlepiej ustawić je w platform_settings, a nie tylko w poleceniu, ale najważniejsze reguły warto dodać w obu miejscach. Umieść je w poleceniu systemowym i jako osobny custom guardrail. Dzięki temu masz podwójną ochronę: jeśli LLM się pomyli, walidator odpowiedzi wyłapie to zanim coś trafi do użytkownika.
Dodaj testy
Zanim pokażesz agenta prawdziwym użytkownikom, sprawdź, czy działa jak trzeba. ElevenAgents obsługuje trzy rodzaje testów i zwykle warto użyć wszystkich. Testy odpowiedzi sprawdzają, czy agent mówi to, co trzeba i w odpowiednim tonie. Testy narzędzi sprawdzają, czy wywołuje właściwe narzędzie z dobrymi parametrami. Testy symulacji sprawdzają, czy rozmowa trzyma się całości, nawet gdy użytkownik zbacza z tematu.

Podłącz do telefonu
Do tej pory agent działa tylko w dashboardzie. Podpięcie numeru telefonu przekierowuje ruch głosowy przez operatora, umożliwiając połączenia przychodzące i wychodzące. Rozmówcy mogą dzwonić do agenta, agent może dzwonić do nich, a dźwięk idzie przez operatora. ElevenAgents ma natywne integracje z Twilio, SIP trunk, Vonage, Telnyx, Plivo i Genesys – nie ma po drodze zewnętrznego serwera ani ręcznego ustawiania TwiML. Całość – od modelu głosu, przez LLM, po operatora – działa w jednej platformie.
Natywna integracja z Twilio to najszybsza konfiguracja. Importujesz numer Twilio do dashboardu ElevenAgents, podajesz Account SID i Auth Token, a platforma sama ustawia webhooks i format audio. Warto wiedzieć: numery kupione w Twilio obsługują połączenia przychodzące i wychodzące. Numery zweryfikowane jako caller ID w Twilio obsługują tylko połączenia wychodzące.
Wskazówka: jeśli nie masz jeszcze Twilio, przycisk Talk to Agent w dashboardzie działa w przeglądarce. Numer telefonu jest do produkcji.
Teraz masz agenta głosowego, który nie brzmi jak robot.

.webp&w=3840&q=80)

.webp&w=3840&q=80)
