🧠 So baust du einen KI-Voice-Agenten mit ElevenLabs & n8n

Minuten Lesezeit

Self-Hosted Voice KI trifft Automatisierung – ganz ohne Code

KI-Anrufe stecken im deutschsprachigen Raum noch in den Kinderschuhen – dabei bieten sie enormes Potenzial. In diesem Artikel zeige ich dir, wie du in wenigen Schritten einen eigenen Voice-Agenten mit ElevenLabs erstellst und diesen mit einem n8n-Workflow verbindest. So entsteht ein intelligenter KI-Telefonagent, der beispielsweise Fragen zu einer Immobilie rund um die Uhr beantworten kann, automatisiert Daten abruft und sogar Termine vereinbart.

Das Beste: Alles läuft auf deiner eigenen Infrastruktur – per Webhook, Pinecone Vektordatenbank und Google Sheets. Kein technisches Vorwissen nötig.

‍

Warum KI-Sprachanrufe mehr als ein Gimmick sind

Stell dir vor: Jemand läuft durch die Stadt, sieht im Schaufenster ein Immobilienangebot – und scannt den QR-Code daneben. Statt auf eine Website zu stoßen, wird er direkt mit einem Voice-Agent verbunden, der Fragen zur Wohnung beantwortet. Genau das ist möglich, wenn du ElevenLabs mit n8n kombinierst.

Dieser Voice-Agent kann:

selbstständig auf deine Datenbanken zugreifen
Fragen beantworten wie „Gibt es eine Bushaltestelle in der Nähe?“ oder „Wie hoch ist der Kaufpreis?“
Gespräche natürlich führen, pausieren oder sogar unterbrechen lassen
Daten aktualisieren oder weiterleiten – z. B. an dein CRM oder Buchungstool

Schritt 1: Die Datengrundlage vorbereiten

Im Beispiel wurde ein Google Sheet als Datenquelle verwendet. Das Dokument enthält Informationen zur Immobilie: Baujahr, Wohnfläche, Preis, Verkehrsanbindung und besondere Merkmale wie Terrasse oder Garage.

Diese Daten werden mithilfe eines Mini-Workflows in eine Vektordatenbank (Pinecone) hochgeladen. Der Vorteil: KI-Agenten können so Inhalte semantisch analysieren und präzise abrufen – ideal für natürlich wirkende Dialoge.

Schritt 2: n8n-Workflow mit Webhook einrichten

Innerhalb von n8n wird ein Webhook erstellt, der auf Anfragen von außen (also von ElevenLabs) reagiert. Der Workflow sieht dabei so aus:

Webhook-Trigger (statt manuellem Start)
Google Drive Node zur Anbindung des Sheets
Pinecone Node, um Daten in den Vector Store zu laden
Optional: ein KI-Agent zur Logiksteuerung

Die Kommunikation erfolgt über JSON – ElevenLabs sendet eine Anfrage, n8n verarbeitet die Daten und sendet die Antwort zurück.

Schritt 3: ElevenLabs Voice-Agent konfigurieren

In ElevenLabs wird ein neuer Agent erstellt – Sprache: Deutsch. Dabei gibst du folgende Elemente an:

Begrüßungstext, z. B.: „Hallo, ich bin Ihr Immobilienberater für die Zweizimmerwohnung in Cottbus.“
Systemprompt (ähnlich wie bei ChatGPT), z. B.:
„Du bist ein spezialisierter Immobilienberater. Deine Aufgabe ist es, Fragen zu dieser Immobilie mithilfe der Pinecone-Datenbank zu beantworten – klar, freundlich und vollständig.“
Sprachmodell: z. B. Gemini 1.5 Flash (schnelle Antwortzeit)
Webhook-Verknüpfung zu n8n: Damit werden Antworten live generiert

Im Tool-Bereich von ElevenLabs fügst du den Webhook als „Custom Tool“ hinzu, gibst Methode und URL an – und schon ist dein Voice-Agent einsatzbereit.

Erweiterungsideen für echte Business-Anwendung

Der fertige Agent kann bereits Fragen beantworten. Doch das System ist beliebig erweiterbar:

Terminbuchungen per Spracheingabe
Leads automatisch erfassen und an ein CRM senden
Mehrsprachige Antworten je nach Anrufer
Dynamische Gesprächsverläufe auf Basis von Benutzerprofilen

Weil alles über Webhooks und n8n gesteuert wird, sind deiner Kreativität kaum Grenzen gesetzt.

Fazit: Voice-Agenten mit KI bauen – einfach, skalierbar, beeindruckend

Mit Tools wie ElevenLabs und n8n kannst du in kurzer Zeit leistungsfähige KI-Sprachagenten erstellen – auf eigener Infrastruktur, mit deinen Daten und nahezu beliebigen Automatisierungen. Ob für Immobilien, Support oder E-Commerce: Der Einsatzbereich ist riesig.

Wenn du schon heute beginnst, kannst du mitgestalten, wie Sprach-KI morgen genutzt wird.

‍

Teile den Blogpost: