ElevenAgents mit Claude Code erstellen
- Veröffentlicht
- Zuletzt aktualisiert
AnhörenArtikel anhören
Früher brauchte man für Voice Agents mehrere Anbieter und viel Zeit. Jetzt können Sie mit Claude Code einen Agenten von Anfang bis Ende an einem Nachmittag bauen. Diese Anleitung führt Sie durch alle Schritte: Persona, Wissensdatenbank, Workflow, Tools, Schutzmechanismen, Tests und eine Telefonnummer, die Sie anrufen können.
Was Sie an einem Nachmittag bauen können:
- Voice Agent, der Sie mit einem Briefing zu nächtlichen CI-Fehlern weckt
- Mehrsprachige Support-Hotline für Ihr Nebenprojekt – noch heute Nachmittag
- Interaktiver Agent für Ihre Portfolio-Seite, der wie Sie spricht
Die Einschränkungen, die Voice Agents früher mechanisch wirken ließen – Latenz, Prosodie, Gesprächsführung – haben sich deutlich verbessert. Unser schnellstes Modell läuft mit etwa 75 ms Latenz und einem Turn-Taking-Modell, das Pausen und Unterbrechungen in Echtzeit verarbeitet. Eleven v3 ist unser ausdrucksstärkstes TTS-Modell und kann Tonlage wechseln, lachen und seufzen wie ein Mensch.
Schnelle Einrichtung
Installieren Sie zunächst das ElevenLabs-Skill mit folgendem Prompt in Claude Code:
Führen Sie dann das setup-api-key-Skill aus, um Ihren ElevenLabs API-Schlüssel zu verbinden:
Tipp: Beschränken Sie den Schlüssel auf "agents-write" und setzen Sie ein tägliches Ausgabenlimit. Endlosschleifen können schnell Guthaben verbrauchen.
Agent erstellen
ElevenAgents ist so aufgebaut, dass Sie in Claude Code mit einfachen Prompts in wenigen Minuten einen produktionsreifen Voice Agent erstellen können. Der Rest dieser Anleitung besteht aus solchen Prompts – vom leeren Workspace bis zur Telefonnummer, die Sie anrufen können.
Beginnen wir mit dem Agenten selbst. Dieser erste Prompt erstellt einen Agenten mit Persona, Stimme und LLM für das Reasoning. Noch keine Tools, keine Wissensdatenbank, kein Workflow – nur der schnellste Weg zum minimal funktionsfähigen Agenten.

Wissensdatenbank hinzufügen
Eine Wissensdatenbank ist die Sammlung von Dokumenten, URLs und FAQs, auf die Ihr Agent bei Fragen zugreifen kann. ElevenAgents übernimmt die gesamte Retrieval-Pipeline (RAG, Retrieval-Augmented Generation) für Sie. Bei einer Nutzeranfrage durchsucht die Plattform die indizierten Inhalte, zieht die relevantesten Abschnitte heraus und gibt sie dem LLM als Kontext weiter. Quellen werden automatisch neu indiziert, wenn sie sich ändern – Ihr Agent bleibt also immer synchron mit Ihren Dokumenten, ohne dass Sie etwas erneut hochladen müssen.

Workflow hinzufügen
Ein einzelner Agent mit einem Prompt eignet sich gut für spezifische Aufgaben. Workflows erweitern das auf mehrstufige Gespräche mit mehreren Intentionen. Statt alle möglichen Verhaltensweisen in einen System-Prompt zu packen, teilen Sie den Agenten in Knoten auf, die jeweils eine bestimmte Intention abdecken, und leiten zwischen ihnen weiter – je nach Bedarf des Anrufers. Jeder Knoten hat sein eigenes Verhalten, und die Übergänge werden durch Bedingungen gesteuert, die ein LLM bewertet.

Tools hinzufügen
ElevenAgents unterstützt drei Tool-Kategorien, die jeweils unterschiedliche Aufgaben übernehmen. Client-Tools führen UI-Aktionen im Frontend aus, damit der Agent navigieren, markieren oder Inhalte aktualisieren kann. Webhook-Tools rufen Ihre Server-APIs auf – so liest oder schreibt der Agent Daten in Ihren Systemen. Eingebaute Tools decken gängige Plattformaktionen ab, die Sie nicht selbst bauen möchten, z. B. Anruf beenden, Sprache des Anrufers erkennen oder an einen Menschen weiterleiten.
.webp&w=3840&q=95)
Schutzmechanismen hinzufügen
Schutzmechanismen laufen unabhängig vom LLM und fangen so Fälle ab, die Ihr System-Prompt nicht abdeckt. Die allgemeine Empfehlung ist, sie in den platform_settings zu konfigurieren und nicht nur im System-Prompt. Für besonders kritische Regeln sollten Sie beides tun: im System-Prompt und als eigenen Schutzmechanismus. So schaffen Sie eine mehrstufige Absicherung – falls das LLM von den Vorgaben abweicht, greift der Response-Validator ein, bevor etwas beim Nutzer ankommt.
Tests hinzufügen
Bevor Sie Ihren Agenten echten Nutzern bereitstellen, sollten Sie prüfen, ob er wie gewünscht funktioniert. ElevenAgents unterstützt drei Testarten – meist empfiehlt sich der Einsatz aller drei. Response-Tests prüfen, ob der Agent das Richtige im richtigen Ton sagt. Tool-Call-Tests prüfen, ob das richtige Tool mit den richtigen Parametern aufgerufen wird. Simulationstests prüfen, ob der mehrstufige Gesprächsfluss auch bei unerwarteten Verläufen stabil bleibt.

Telefonanbindung
Bis hierhin läuft der Agent nur im Dashboard. Die Verbindung mit einer Telefonnummer leitet Sprachverkehr über einen Telefonieanbieter und ermöglicht eingehende und ausgehende Anrufe. Anrufer können den Agenten anrufen, der Agent kann selbst anrufen, und das Audio wird über den Anbieter übertragen. ElevenAgents bietet native Integrationen für Twilio, SIP-Trunk, Vonage, Telnyx, Plivo und Genesys – es gibt also keinen zusätzlichen Media-Server und keine manuelle TwiML-Routing-Pflege. Die gesamte Kette – vom Voice-Modell über das LLM bis zum Telefonieanbieter – läuft in einer Plattform.
Die native Twilio-Integration ist am schnellsten eingerichtet. Sie importieren eine Twilio-Nummer ins ElevenAgents-Dashboard mit Ihrem Account SID und Auth Token, und die Plattform konfiguriert Webhooks und Audioformat automatisch. Wichtig zu wissen: Über Twilio gekaufte Nummern unterstützen eingehende und ausgehende Anrufe. Als Caller-ID verifizierte Nummern in Twilio unterstützen nur ausgehende Anrufe.
Tipp: Wenn Sie noch kein Twilio haben, funktioniert der Button „Mit Agent sprechen“ im Dashboard direkt im Browser. Die Telefonnummer ist für den Produktivbetrieb gedacht.
Jetzt haben Sie einen Voice Agent, der nicht wie einer klingt.

.webp&w=3840&q=80)

.webp&w=3840&q=80)
