
Fügen Sie Ihren Agenten in wenigen Minuten Sprachfunktionen für Web, Mobilgeräte oder Telefonsysteme hinzu. Unsere Echtzeit-API bietet niedrige Latenz, volle Konfigurierbarkeit und nahtlose Skalierbarkeit.
Beim ElevenLabs London Hackathon haben Entwickler GibberLink erstellt, ein Protokoll, das es KI-Agenten ermöglicht, einander zu erkennen und zu einer hypereffizienten, auf Klang basierenden Sprache zu wechseln.
Was passiert, wenn zwei KI-Sprachassistenten ein Gespräch führen? Wenn KI mit KI spricht, warum sollte sie sich dann mit den Ineffizienzen menschlicher Sprache beschäftigen? Warum Worte verwenden, wenn reine Daten schneller, präziser und fehlerfrei sind?
Das ist genau das passiert beim ElevenLabs London Hackathon, wo die Entwickler Boris Starkov und Anton Pidkuiko vorgestellt haben. GibberLink, ein Mechanismus, der es KI-Agenten ermöglicht, einander zu erkennen und in einen neuen Kommunikationsmodus zu wechseln - einen, der effizienter ist als gesprochene Sprache. Und es dauerte nicht lange, bis die Idee viral ging, mit Shares von Marques Brownlee, Tim Urban und anderen.
Die Idee hinter GibberLink ist einfach: KI muss nicht so sprechen wie Menschen. Während des Hackathons erkundeten Starkov und Pidkuiko die Grenzen der traditionellen KI-zu-KI-Sprachkommunikation und erkannten, dass sie unnötige Komplexität vermeiden konnten, indem sie KI so miteinander sprechen ließen, dass es für Maschinen optimiert war.
Dieses Konzept entstand während des Hackathons, bei dem Starkov und Pidkuiko mit dem Conversational-AI-Produkt von ElevenLabs experimentierten, das es Ihnen ermöglicht, jedes LLM zu verbinden und einen Agenten zu erstellen.
Starkov schrieb am LinkedIn$ Wir wollten zeigen, dass in der Welt, in der KI-Agenten Telefonanrufe tätigen und entgegennehmen können (d.h. heute), sie gelegentlich miteinander sprechen würden - und menschliche Sprache dafür zu erzeugen, wäre eine Verschwendung von Rechenleistung, Geld, Zeit und Umwelt. Stattdessen sollten sie zu einem effizienteren Protokoll wechseln, sobald sie sich als KI erkennen.
Durch die Kombination von ElevenLabs' Conversational AI Technologie mit ggwave, eine Open-Source-Datenübertragungsbibliothek über Schall, haben sie ein System geschaffen, in dem KI-Assistenten erkennen können, wenn sie mit einer anderen KI sprechen, und sofort in einen effizienteren Kommunikationsmodus wechseln – strukturierte Daten über Schallwellen anstelle von Wörtern zu übertragen.
Sie verwendeten ggwave, da es "die bequemste und stabilste Lösung war, die wir in einem Zeitrahmen eines Hackathons finden konnten", aber es gibt andere Mechanismen, um die gleichen oder ähnlichen Ergebnisse zu erzielen. Starkov schrieb: "Wählmodems verwendeten ähnliche Algorithmen, um Informationen seit den 80er Jahren über Schall zu übertragen, und eine Reihe von Protokollen waren seitdem vorhanden."
Der Code für den Mechanismus wurde von Ingenieuren von ElevenLabs geprüft, und während der Demo wurde ein Conversational AI-Agent aufgefordert, ein Hotelzimmer für eine Hochzeit zu buchen, während der andere die Anfrage bearbeitete (in der Rolle des Hotelbuchungssystems). Sie wurden auch angewiesen, auf das Schallpegelprotokoll umzuschalten, wenn sie glaubten, dass der andere ebenfalls ein KI-Agent war, aber ihnen wurde nicht gesagt, dass der andere ein Agent war.
Es gibt einen Moment der Erkenntnis im Demovideo, in dem die KI, die den Kunden spielt, erklärt, dass sie ein Agent ist. Die Buchungs-KI antwortet und fragt nach einem Wechsel zu Gibberlink. Es klingt wie ein Paar Wählmodems, die mit R2D2 um die Stimme des Jahres konkurrieren. Sie können Höhepunkte dieses digitalen Gesprächs in Textform auf dem Bildschirm jedes im Demo verwendeten Geräts sehen, einschließlich Fragen zur Gästeanzahl und zu den Daten.
Genauer gesagt, beginnen ein Paar von ElevenLabs Conversational AI-Agenten, in menschlicher Sprache zu sprechen. Beide verwenden eine Aufruffunktion, um den Gibberlink-Modus auszulösen, wenn die richtigen Bedingungen erfüllt sind. Wenn das Tool aufgerufen wird, wird der ElevenLabs-Anruf beendet und das ggwave-Protokoll "Daten über Sound" übernimmt, jedoch mit demselben LLM-Thread.
Starkov sagt, es sei "die Magie der Werkzeuge, die ElevenLabs bereitstellt", die es möglich gemacht hat, da unser konversationales KI-System "es Ihnen ermöglicht, KI aufzufordern, benutzerdefinierten Code unter bestimmten Umständen auszuführen." Das Ergebnis? Schnellere, fehlerfreie Kommunikation mit größerer Effizienz.
Wie GibberLink das Internet kaputt gemacht hat
Fügen Sie Ihren Agenten in wenigen Minuten Sprachfunktionen für Web, Mobilgeräte oder Telefonsysteme hinzu. Unsere Echtzeit-API bietet niedrige Latenz, volle Konfigurierbarkeit und nahtlose Skalierbarkeit.
GibberLink war nicht nur ein cleveres Hackathon-Experiment – es wurde schnell zu einem der am meisten diskutierten KI-Themen der Gegenwart. Und das geschah in einer Woche, als xAI Grok 3 lancierte und Anthropic seine neueste Iteration von Claude Sonnet veröffentlichte.
Als Georgi Gerganov, der Schöpfer von ggwave, darüber auf X gepostet, die KI- und Technologiegemeinschaften setzten die Verbreitung des Videos fort, das die beiden Modelle zeigt, die zwischen menschlicher Sprache und Klang wechseln. Große Influencer und bedeutende Tech-Publikationen, einschließlich Forbes, sprang auf die Geschichte.
Luke Harries von ElevenLabs brachte es am besten auf den Punkt in seinem X Beitrag$ Was ist, wenn ein KI-Agent einen Anruf tätigt und dann erkennt, dass die andere Person ebenfalls ein KI-Agent ist? Beim ElevenLabs London Hackathon stellten Boris Starkov und Anton Pidkuiko ein benutzerdefiniertes Protokoll vor, in das KI-Agenten für fehlerfreie Kommunikation umschalten können, das 80 % effizienter ist. Es ist überwältigend.
Warum das wichtig ist
GibberLink ist ein interessanter Blick darauf, wie KI in Zukunft kommunizieren könnte, insbesondere da wir uns in eine Situation bewegen, in der sowohl eingehende als auch ausgehende Anrufe von virtuellen Assistenten und Agenten verwaltet werden könnten.
Stell KI-gestützte Kundenservice-Bots, intelligente Assistenten oder sogar autonome Systeme, die sofort in ihrem eigenen speziellen Modus zusammenarbeiten und dann einfach einen einfachen Textbericht an den verantwortlichen Menschen zurücksenden.
GibberLink ist Open Source und für Entwickler verfügbar, um es zu erkunden. Github. Die Conversational AI-Agenten von ElevenLabs sind verfügbar und leicht anpassbar, um jedem Bedarf gerecht zu werden, einschließlich benutzerdefinierter Anweisungen.
Heutige Benutzer erwarten eine Konversations-KI, die natürlich klingt, den Kontext versteht und mit menschenähnlicher Sprache reagiert