Wie nutze ich den MCP-Server mit Claude oder Cursor?

Der MCP-Server ist für die nahtlose Zusammenarbeit mit Tools wie Claude Desktop und Cursor konzipiert. Sobald der Server lokal läuft, können Sie Agenten erstellen, Prompts eingeben und direkt aus Ihrer KI-nativen Entwicklungsumgebung auf die ElevenLabs Audio-APIs zugreifen.

Kann ich mit dem MCP-Server Sprache generieren und Stimmen klonen?

Ja. Mit dem Server können Sie Sprache aus einfachen Texteingaben generieren, Stimmen, die Sie im ElevenLabs Voice Designer erstellt haben, klonen und mit dem MCP-Server nutzen sowie mehreren Projekten verschiedene Stimmen zuweisen. Es ist der flexibelste Weg, lokal mit der ElevenLabs Audioplattform zu arbeiten.

Unterstützt der MCP-Server die Transkription von Audiodateien?

Ja. Der Server macht es einfach, Audiodateien in klaren, lesbaren Text zu transkribieren. Perfekt, um Meetings, Interviews oder Anrufaufzeichnungen mit der leistungsstarken ElevenLabs Audioverarbeitung in schriftliche Inhalte umzuwandeln.

Direkt zum Inhalt

Anmelden Registrieren

Kontakt Zur App

Anmelden Registrieren

Blog Entwickler

Vorstellung von ElevenLabs MCP

Q: Was ist der ElevenLabs MCP-Server?

Der offizielle ElevenLabs MCP-Server ist ein lokaler, quelloffener Server, der Entwicklern direkten Zugriff auf die ElevenLabs KI-Audioplattform bietet. Er unterstützt Text zu Sprache, Audiotranskription, Stimmenklonen und ermöglicht es, fortschrittliche Sprachagenten zu entwickeln, die ausgehende Anrufe tätigen können.

Zuletzt aktualisiert 6. März 2026 • 5 Minuten Lesezeit

Smiling young man with short hair in a black polo shirt, black and white photo.

Louis Jordan, Engineering

Geben Sie Claude und Cursor Zugriff auf die gesamte ElevenLabs KI-Audioplattform – einfach per Texteingabe.

Mehr erfahren Vertrieb kontaktieren ElevenLabs MCP

Wollten Sie schon immer einen Sprachagenten bauen, der Ihnen das Mittagessen bestellt? Oder einen, der Ihre Meetings transkribiert? Oder Ihre E-Mails in Ihrer eigenen Stimme vorliest? Mit dem offiziellen ElevenLabs Model Context Protocol (MCP)Server ist das jetzt möglich.

Der MCP-Server ermöglicht es Ihnen, KI-Aufgaben über lokale Tools zu steuern. Egal ob Sie Claude, Cursor oder ein eigenes Skript nutzen – Sie können Konversationelle KI-Sprachagenten erstellen, ausgehende Anrufe tätigen, Sprache transkribieren und Audio generieren – alles mit einfachen API-Aufrufen.

In diesem Artikel zeigen wir Ihnen, wie Sie mit unserem MCP-Server starten. Nutzen Sie dazu unser GitHub-Repository und sehen Sie Beispiele, was Sie damit umsetzen können.

Introducing the official ElevenLabs MCP server.

Give Claude and Cursor access to the entire ElevenLabs AI audio platform via simple text prompts.

You can even spin up voice agents to perform outbound calls for you — like ordering pizza. pic.twitter.com/H0OttYgXZn
— ElevenLabs (@elevenlabsio) April 7, 2025

Some examples:
- Text to Speech: Read aloud content or create audiobooks.
- Speech to Text: Transcribe audio and video into text.
- Voice Designer: Create custom AI voices.
- Conversational AI: Build dynamic voice agents and make outbound calls. pic.twitter.com/dObTzlliZ7
— ElevenLabs (@elevenlabsio) April 7, 2025

Was ist der ElevenLabs MCP-Server?

Der ElevenLabs MCP-Server ist eine Abstraktionsschicht über der ElevenLabs API, die einem großen Sprachmodell Kontext gibt, um auf die gesamte ElevenLabs KI-Audioplattform zuzugreifen. Er dient als entwicklerfreundliche lokale Schnittstelle, die Anfragen an die ElevenLabs Cloud-APIs weiterleitet. Möchten Sie Sprache generieren? Eine Stimme klonen? Audio aus einer Datei transkribieren? Mit dem MCP-Server haben Sie alles direkt auf Ihrem Rechner.

Der MCP-Server ist vollständig kompatibel mit Claude Desktop, Cursor und anderen KI-nativen Entwicklungsumgebungen. Starten Sie einen Sprachagenten, definieren Sie sein Verhalten per System-Prompt und führen Sie ausgehende Anrufe durch – direkt aus Ihrer IDE oder Ihrem KI-Assistenten.

Während der Server lokal läuft und Workflows auf Ihrem Rechner steuert, kommuniziert er sicher mit den ElevenLabs Cloud-APIs, um Audiogenerierung, Stimmenklonen und Transkription durchzuführen. Ideal zum Testen neuer Funktionen. Sie behalten die Kontrolle über Daten, Abläufe und Nutzererlebnis. Einfach anschließen und loslegen.

Nach der Installation können Sie mit dem ElevenLabs MCP-Server reale Anwendungen entwickeln, die sprechen, zuhören und verstehen. Nutzen Sie das gesamte Spektrum der ElevenLabs KI-Audioplattform – per Texteingabe und API-Aufruf. Zum Beispiel können Sie Sprachagenten erstellen, die ausgehende Anrufe tätigen – egal ob Sie eine Pizza bestellen, einen Termin buchen oder einen Kontakt nachfassen möchten.

Hier sind einige weitere Anwendungsbeispiele, die wir uns überlegt haben:

"Erstellen Sie einen KI-Agenten, der wie ein Film-Noir-Detektiv spricht und Fragen zu klassischen Filmen beantworten kann"
"Erzeugen Sie drei Stimmvarianten für einen weisen, uralten Drachencharakter. Ich wähle dann meine Lieblingsstimme aus und füge sie meiner Stimmbibliothek hinzu"
"Wandeln Sie diese Aufnahme meiner Stimme so um, dass sie wie ein Ritter aus dem Mittelalter klingt"
"Erstellen Sie eine Klanglandschaft eines Gewitters im dichten Dschungel, mit Tieren, die auf das Wetter reagieren"
"Wandeln Sie diese Rede in Text um, erkennen Sie verschiedene Sprecher und wandeln Sie sie dann mit individuellen Stimmen für jede Person zurück"

So starten Sie mit dem ElevenLabs MCP-Server

Der Einstieg mit dem offiziellen ElevenLabs MCP-Server dauert nur wenige Minuten. Egal ob Sie Sprachagenten entwickeln oder Audiotools lokal testen – hier finden Sie die Schritt-für-Schritt-Anleitung.

Registrieren Sie sich für ein ElevenLabs-Konto: Registrieren Sie sich für ein kostenloses oder kostenpflichtiges Konto. Damit erhalten Sie Zugriff auf die gesamte ElevenLabs KI-Audioplattform, inklusive Tools für Text zu Sprache, Stimmenklonen und Audiotranskription.
API-Schlüssel generieren: Nach dem Login gehen Sie zu Ihren Kontoeinstellungen und generieren einen neuen API-Schlüssel. Diesen benötigen Sie, um Anfragen von Ihrem lokalen MCP-Server an die ElevenLabs-Dienste zu authentifizieren.
Offizielles MCP-Server-Repository klonen: Besuchen Sie das offizielle ElevenLabs MCP GitHub-Repository und klonen Sie es auf Ihren Rechner. Das Repository enthält alles, was Sie benötigen, um den Server lokal zu betreiben und zu testen.
Abhängigkeiten installieren: Folgen Sie der Installationsanleitung in der README des Repos. Dazu gehört die Installation der benötigten Python-Pakete und das Einrichten der Laufzeitumgebung. Möglicherweise müssen Sie auch Umgebungsvariablen für Ihren API-Schlüssel und Standardeinstellungen konfigurieren.
MCP-Server lokal starten: Nach der Installation starten Sie den Server mit den bereitgestellten CLI-Befehlen. Der MCP-Server läuft dann und stellt Endpunkte für Audiogenerierung, Sprachtranskription und Konversationelle KI bereit.
Verbinden mit Claude, Cursor oder CLI: Verbinden Sie Tools wie Claude Desktop oder Cursor, um per Kommandozeile oder HTTP-Aufruf mit dem MCP-Server zu interagieren. So ermöglichen Sie nahtlose Workflows zwischen Ihrem KI-Assistenten und der ElevenLabs-Plattform. Starten Sie Agenten und geben Sie Prompts wie „Bestelle mir eine Pizza“ oder „Lies dieses PDF vor“.
Experimentieren und entwickeln: Sobald der Server läuft, können Sie Audio generieren, Stimmen klonen, Dateien transkribieren und Sprachagenten für ausgehende Anrufe erstellen – alles lokal. Nutzen Sie die Beispiele im Repository oder entwickeln Sie eigene Workflows.

Fazit

Der offizielle ElevenLabs MCP-Server eröffnet neue Möglichkeiten für Entwickler im Bereich Voice-KI. Zum ersten Mal können Sie die gesamte ElevenLabs KI-Audioplattform direkt von Ihrem Rechner aus steuern.

Keine eingeschränkten Workflows mehr. Nur noch schnelle, flexible und voll ausgestattete Audiotools, die sich nahtlos in Ihre bevorzugten Entwicklungsumgebungen wie Claude Desktop und Cursor integrieren.

Ob Sie die nächste Generation von Sprachagenten entwickeln oder einfach mit moderner Audiotechnologie experimentieren möchten – der MCP-Server gibt Ihnen die Freiheit, kreativ zu werden. Bereit, etwas Neues zu bauen?

Jetzt registrieren bei ElevenLabs.

Text to Speech

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

Häufige Fragen

Ja – der ElevenLabs MCP-Server ist quelloffen und kann kostenlos als lokaler Server betrieben werden. Die Audiogenerierung und Transkription erfolgt jedoch weiterhin über die ElevenLabs Cloud-APIs. Sie benötigen ein ElevenLabs-Konto und einen API-Schlüssel, um vollen Zugriff auf alle Funktionen der Plattform zu erhalten, einschließlich Sprachagenten für ausgehende Anrufe, Audiobearbeitung und mehr.