Pomiń

Budowanie ElevenAgents z Claude Code

Opublikowano
Ostatnia aktualizacja

PosłuchajPosłuchaj tego artykułu

Kiedyś do stworzenia agenta głosowego trzeba było sprintu i kilku dostawców. Teraz zbudujesz go od A do Z w jedno popołudnie z Claude Code. Ten przewodnik przeprowadzi cię przez cały proces: persona, baza wiedzy, workflow, narzędzia, zabezpieczenia, testy i numer telefonu, pod który możesz zadzwonić.

Co możesz zbudować w jedno popołudnie:

  • Agent głosowy, który budzi cię i podaje podsumowanie nocnych błędów CI
  • Wielojęzyczna infolinia do twojego projektu pobocznego jeszcze dziś
  • Interaktywny agent na twoją stronę portfolio, który mówi jak ty

Ograniczenia, przez które agenci głosowi brzmieli sztucznie – opóźnienia, intonacja, zmiany w rozmowie – bardzo się poprawiły. Nasz najszybszy model działa z opóźnieniem ok. 75 ms i obsługuje pauzy oraz przerwy w czasie rzeczywistym. Eleven v3 to nasz najbardziej ekspresyjny model TTS – potrafi zmieniać ton, śmiać się i wzdychać jak człowiek.

Szybka konfiguracja

Najpierw zainstaluj ElevenLabs skill tym poleceniem w Claude Code:

Install the ElevenLabs skill globally - npx skills add elevenlabs/skills

Następnie uruchom skill setup-api-key, żeby podpiąć swój klucz ElevenLabs API:

Set up the elevenlabs key using the setup-api-key skill.

Wskazówka: ustaw zakres klucza tylko na "agents-write" i limit dziennych wydatków. Błędna pętla może szybko zużyć środki.

Stwórz agenta

ElevenAgents pozwala ci uruchomić gotowego do pracy agenta głosowego w Claude Code w kilka minut, używając poleceń w języku naturalnym. Dalej znajdziesz kolejne polecenia – od pustego workspace do numeru telefonu, pod który można zadzwonić.

Zacznijmy od samego agenta. To pierwsze polecenie tworzy agenta z personą, głosem i LLM do rozumowania. Bez narzędzi, bazy wiedzy czy workflow – najszybsza droga od zera do działającego agenta.

Create an ElevenAgent: a warm, knowledgeable product expert. Use a v3 conversational voice and Qwen-3.6 as the LLM. Return the dashboard URL.
Agent builder home page web UI

Dodaj bazę wiedzy

Baza wiedzy to zestaw dokumentów, linków i FAQ, do których agent sięga, gdy ktoś o coś pyta. ElevenAgents obsługuje cały proces wyszukiwania (RAG). Gdy użytkownik pyta, platforma przeszukuje indeks, wybiera najtrafniejsze fragmenty i przekazuje je LLM jako kontekst do odpowiedzi. Źródła są automatycznie reindeksowane po zmianach, więc agent zawsze korzysta z aktualnych danych – nie musisz nic ponownie wrzucać.

Add a knowledge base to my agent. Index 
https://elevenlabs.io/docs/eleven-agents/overview
 and ./README.md if it exists. 

Auto-reindex on.
Knowledge Base interface showing files, storage, and add options

Dodaj workflow

Jeden agent z jednym poleceniem dobrze radzi sobie z prostymi zadaniami. Workflow pozwala prowadzić rozmowy z wieloma intencjami. Zamiast upychać wszystko w jednym poleceniu, dzielisz agenta na węzły, z których każdy obsługuje konkretną intencję, a przejścia między nimi zależą od potrzeb rozmówcy. Każdy węzeł ma swoje zachowanie, a przejścia są oceniane przez LLM.

Add a workflow to my agent: greeting, classify intent, then branch to either answer from KB or escalate to human, then wrap up.
Agent workflow visual builder of Customer support call flow diagram detailing issue identification, troubleshooting, and resolution steps.

Dodaj narzędzia

ElevenAgents obsługuje trzy typy narzędzi, każde do czegoś innego. Narzędzia klienckie wykonują akcje w interfejsie, więc agent może np. nawigować, podświetlać lub zmieniać to, co widzi użytkownik. Webhooki wywołują twoje API, dzięki czemu agent czyta lub zapisuje dane w twoich systemach. Wbudowane narzędzia to typowe akcje platformy, których nie musisz sam budować, np. zakończenie rozmowy, wykrycie języka rozmówcy czy przekierowanie do człowieka.

Add three tools to my agent: 
1. A client tool called show_help_article that takes an article_id. 
2. A webhook tool called get_weather hitting 
https://wttr.in/
{location}?format=j1. 
3. Enable the built-in end_call and language_detection tools.
Diagram of an ElevenAgents connecting client tools, system tools, and integration tools with webhooks, MCP, and native integrations.

Dodaj zabezpieczenia

Zabezpieczenia działają niezależnie od LLM, więc wychwytują przypadki, których nie przewidziałeś w poleceniu systemowym. Najlepiej ustawić je w platform_settings, a nie tylko w poleceniu, ale najważniejsze reguły warto dodać w obu miejscach. Umieść je w poleceniu systemowym i jako osobny custom guardrail. Dzięki temu masz podwójną ochronę: jeśli LLM się pomyli, walidator odpowiedzi wyłapie to zanim coś trafi do użytkownika.

Add guardrails to my agent. Enable focus and prompt injection protection. Add custom rules to block specific pricing claims, speculation about unreleased features, and any write access to billing systems.

Dodaj testy

Zanim pokażesz agenta prawdziwym użytkownikom, sprawdź, czy działa jak trzeba. ElevenAgents obsługuje trzy rodzaje testów i zwykle warto użyć wszystkich. Testy odpowiedzi sprawdzają, czy agent mówi to, co trzeba i w odpowiednim tonie. Testy narzędzi sprawdzają, czy wywołuje właściwe narzędzie z dobrymi parametrami. Testy symulacji sprawdzają, czy rozmowa trzyma się całości, nawet gdy użytkownik zbacza z tematu.

Add three tests to my agent: one that checks the greeting tone, one that checks it calls show_help_article when asked about password resets, and a simulation that checks if it defers to sales when asked about pricing.
ElevenAgents testing suite being ran to test agents before they reach production

Podłącz do telefonu

Do tej pory agent działa tylko w dashboardzie. Podpięcie numeru telefonu przekierowuje ruch głosowy przez operatora, umożliwiając połączenia przychodzące i wychodzące. Rozmówcy mogą dzwonić do agenta, agent może dzwonić do nich, a dźwięk idzie przez operatora. ElevenAgents ma natywne integracje z Twilio, SIP trunk, Vonage, Telnyx, Plivo i Genesys – nie ma po drodze zewnętrznego serwera ani ręcznego ustawiania TwiML. Całość – od modelu głosu, przez LLM, po operatora – działa w jednej platformie.

Natywna integracja z Twilio to najszybsza konfiguracja. Importujesz numer Twilio do dashboardu ElevenAgents, podajesz Account SID i Auth Token, a platforma sama ustawia webhooks i format audio. Warto wiedzieć: numery kupione w Twilio obsługują połączenia przychodzące i wychodzące. Numery zweryfikowane jako caller ID w Twilio obsługują tylko połączenia wychodzące.

Connect my Twilio account to ElevenAgents. Reserve a +1 number from Twilio's available pool, assign it my ElevenAgent via the native Twilio integration, and return the number to dial.

Wskazówka: jeśli nie masz jeszcze Twilio, przycisk Talk to Agent w dashboardzie działa w przeglądarce. Numer telefonu jest do produkcji.

Teraz masz agenta głosowego, który nie brzmi jak robot.

Podobne artykuły

Twórz z najwyższej jakości audio AI