Bygg ElevenAgents med Claude Code
- Publicerad
- Senast uppdaterad
LyssnaLyssna på den här artikeln
Tidigare krävdes det både sprintar och flera leverantörer för att bygga röstagenter. Nu kan du bygga en från start till mål på en eftermiddag med Claude Code. Den här guiden visar dig hela processen: persona, kunskapsbas, workflow, verktyg, skyddsräcken, tester och ett telefonnummer du kan ringa.
Det här kan du bygga på en eftermiddag:
- Röstagent som väcker dig med en rapport om nattens CI-fel
- Flerspråkig supportlinje för ditt sidoprojekt redan i eftermiddag
- Interaktiv agent till din portfoliosida som pratar som du
Begränsningarna som gjorde röstagenter stela – latens, prosodi, turtagning – har förbättrats rejält. Vår snabbaste modell har runt 75 ms latens och en turtagningsmodell som hanterar pauser och avbrott i realtid. Eleven v3 är vår mest uttrycksfulla TTS-modell och kan byta tonläge, skratta och sucka precis som en människa.
Snabb start
Installera först ElevenLabs-färdigheten med följande prompt i Claude Code:
Kör sedan setup-api-key-färdigheten för att koppla in din ElevenLabs API-nyckel:
Tips: begränsa nyckeln till "agents-write" och sätt ett dagligt kostnadstak. En loop som går fel kan snabbt dra mycket krediter.
Skapa agenten
ElevenAgents är byggt så att du kan skapa en produktionsklar röstagent i Claude Code på några minuter med naturliga prompts. Resten av guiden är en serie sådana prompts, från tom arbetsyta till ett telefonnummer du kan ringa.
Vi börjar med själva agenten. Den här första prompten skapar en agent med persona, röst och en LLM för resonemang. Inga verktyg, ingen kunskapsbas, inget workflow än – bara snabbaste vägen från noll till en fungerande agent.

Lägg till en kunskapsbas
En kunskapsbas är de dokument, webbadresser och FAQ:er som din agent kan använda när någon ställer en fråga. ElevenAgents hanterar hela hämtflödet (RAG, retrieval-augmented generation) åt dig. När en användare frågar något söker plattformen i det indexerade innehållet, plockar ut de mest relevanta delarna och skickar dem till LLM:en som kontext innan svaret genereras. Källor indexeras om automatiskt när de ändras, så agenten håller sig uppdaterad utan att du behöver ladda upp något igen.

Lägg till ett workflow
En agent med en prompt klarar smala uppgifter bra. Workflows gör att agenten kan hantera samtal med flera syften. Istället för att trycka in allt i en systemprompt delar du upp agenten i noder som var och en hanterar en specifik avsikt, och växlar mellan dem beroende på vad den som ringer behöver. Varje nod har sitt eget beteende, och kopplingarna mellan dem styrs av villkor som utvärderas av en LLM.

Lägg till verktyg
ElevenAgents stöder tre typer av verktyg, och alla har olika funktion. Klientverktyg utför UI-åtgärder i frontend, så agenten kan navigera, markera eller uppdatera det användaren ser. Webhook-verktyg anropar dina server-API:er, vilket gör att agenten kan läsa eller skriva data i dina system. Inbyggda verktyg täcker vanliga plattformsfunktioner du inte vill bygga själv, som att avsluta samtalet, upptäcka språk eller koppla vidare till en människa.
.webp&w=3840&q=95)
Lägg till skyddsräcken
Skyddsräcken körs oberoende av LLM:en, vilket gör att de fångar upp specialfall som systemprompten missar. Det vanligaste är att konfigurera dem i platform_settings istället för att bara lita på systemprompten, men för dina viktigaste regler vill du göra båda. Ta med dem i systemprompten och som ett eget skyddsräcke. Då får du ett extra lager skydd: om LLM:en avviker från instruktionerna fångar valideraren upp det innan något når användaren.
Lägg till tester
Innan du låter riktiga användare testa agenten vill du försäkra dig om att den fungerar som tänkt. ElevenAgents stöder tre typer av tester, och du vill oftast använda alla tre. Svarstester kollar att agenten säger rätt sak med rätt ton. Verktygstester kollar att rätt verktyg används med rätt parametrar. Simuleringstester kollar att hela samtalsflödet håller ihop även när samtalet spårar ur.

Koppla till telefon
Hittills har agenten bara körts i dashboarden. Kopplar du den till ett telefonnummer går röstsamtalen via en telekomleverantör, så du kan ta emot och ringa samtal. Den som ringer kan slå numret, din agent kan ringa ut, och ljudet går via telekomleverantören. ElevenAgents har inbyggda integrationer för Twilio, SIP trunk, Vonage, Telnyx, Plivo och Genesys, så du slipper tredjeparts mediaservrar och manuell TwiML-routing. Hela kedjan – från röstmodell till LLM till telekomleverantör – kopplas ihop i en och samma plattform.
Den inbyggda Twilio-integrationen är snabbast att sätta upp. Du importerar ett Twilio-nummer till ElevenAgents dashboard med ditt Account SID och Auth Token, och plattformen konfigurerar automatiskt voice-webhooks och ljudformat. En sak att känna till: Nummer köpta via Twilio stöder både inkommande och utgående samtal. Nummer som är verifierade som uppringar-ID i Twilio stöder bara utgående samtal.
Tips: Om du inte har Twilio än fungerar dashboardens Talk to Agent-knapp direkt i webbläsaren. Telefonnummer behövs för produktion.
Nu har du en röstagent som inte låter som en.

.webp&w=3840&q=80)

.webp&w=3840&q=80)
