Self-Hosted Voice KI trifft Automatisierung – ganz ohne Code
KI-Anrufe stecken im deutschsprachigen Raum noch in den Kinderschuhen – dabei bieten sie enormes Potenzial. In diesem Artikel zeige ich dir, wie du in wenigen Schritten einen eigenen Voice-Agenten mit ElevenLabs erstellst und diesen mit einem n8n-Workflow verbindest. So entsteht ein intelligenter KI-Telefonagent, der beispielsweise Fragen zu einer Immobilie rund um die Uhr beantworten kann, automatisiert Daten abruft und sogar Termine vereinbart.
Das Beste: Alles läuft auf deiner eigenen Infrastruktur – per Webhook, Pinecone Vektordatenbank und Google Sheets. Kein technisches Vorwissen nötig.
‍
Warum KI-Sprachanrufe mehr als ein Gimmick sind
Stell dir vor: Jemand läuft durch die Stadt, sieht im Schaufenster ein Immobilienangebot – und scannt den QR-Code daneben. Statt auf eine Website zu stoßen, wird er direkt mit einem Voice-Agent verbunden, der Fragen zur Wohnung beantwortet. Genau das ist möglich, wenn du ElevenLabs mit n8n kombinierst.
Dieser Voice-Agent kann:
- selbstständig auf deine Datenbanken zugreifen
- Fragen beantworten wie „Gibt es eine Bushaltestelle in der Nähe?“ oder „Wie hoch ist der Kaufpreis?“
- Gespräche natürlich führen, pausieren oder sogar unterbrechen lassen
- Daten aktualisieren oder weiterleiten – z. B. an dein CRM oder Buchungstool
Schritt 1: Die Datengrundlage vorbereiten
Im Beispiel wurde ein Google Sheet als Datenquelle verwendet. Das Dokument enthält Informationen zur Immobilie: Baujahr, Wohnfläche, Preis, Verkehrsanbindung und besondere Merkmale wie Terrasse oder Garage.
Diese Daten werden mithilfe eines Mini-Workflows in eine Vektordatenbank (Pinecone) hochgeladen. Der Vorteil: KI-Agenten können so Inhalte semantisch analysieren und präzise abrufen – ideal für natürlich wirkende Dialoge.
Schritt 2: n8n-Workflow mit Webhook einrichten
Innerhalb von n8n wird ein Webhook erstellt, der auf Anfragen von auĂźen (also von ElevenLabs) reagiert. Der Workflow sieht dabei so aus:
- Webhook-Trigger (statt manuellem Start)
- Google Drive Node zur Anbindung des Sheets
- Pinecone Node, um Daten in den Vector Store zu laden
- Optional: ein KI-Agent zur Logiksteuerung
Die Kommunikation erfolgt über JSON – ElevenLabs sendet eine Anfrage, n8n verarbeitet die Daten und sendet die Antwort zurück.
Schritt 3: ElevenLabs Voice-Agent konfigurieren
In ElevenLabs wird ein neuer Agent erstellt – Sprache: Deutsch. Dabei gibst du folgende Elemente an:
- Begrüßungstext, z. B.: „Hallo, ich bin Ihr Immobilienberater für die Zweizimmerwohnung in Cottbus.“
- Systemprompt (ähnlich wie bei ChatGPT), z. B.:
„Du bist ein spezialisierter Immobilienberater. Deine Aufgabe ist es, Fragen zu dieser Immobilie mithilfe der Pinecone-Datenbank zu beantworten – klar, freundlich und vollständig.“ - Sprachmodell: z. B. Gemini 1.5 Flash (schnelle Antwortzeit)
- Webhook-VerknĂĽpfung zu n8n: Damit werden Antworten live generiert
Im Tool-Bereich von ElevenLabs fügst du den Webhook als „Custom Tool“ hinzu, gibst Methode und URL an – und schon ist dein Voice-Agent einsatzbereit.
Erweiterungsideen fĂĽr echte Business-Anwendung
Der fertige Agent kann bereits Fragen beantworten. Doch das System ist beliebig erweiterbar:
- Terminbuchungen per Spracheingabe
- Leads automatisch erfassen und an ein CRM senden
- Mehrsprachige Antworten je nach Anrufer
- Dynamische Gesprächsverläufe auf Basis von Benutzerprofilen
Weil alles über Webhooks und n8n gesteuert wird, sind deiner Kreativität kaum Grenzen gesetzt.
Fazit: Voice-Agenten mit KI bauen – einfach, skalierbar, beeindruckend
Mit Tools wie ElevenLabs und n8n kannst du in kurzer Zeit leistungsfähige KI-Sprachagenten erstellen – auf eigener Infrastruktur, mit deinen Daten und nahezu beliebigen Automatisierungen. Ob für Immobilien, Support oder E-Commerce: Der Einsatzbereich ist riesig.
Wenn du schon heute beginnst, kannst du mitgestalten, wie Sprach-KI morgen genutzt wird.
‍