Industry

Call Deflection: Was es ist, wie man sie misst und wie KI sie richtig umsetzt

Call Deflection einfach erklärt: was dahintersteckt, wie sich die Deflection Rate berechnen lässt, warum schlechte Deflection nach hinten losgeht und wie KI das Supportaufkommen senkt, indem sie Probleme tatsächlich löst.

May 26, 2026

Call Deflection: Was es ist, wie man sie misst und wie KI sie richtig umsetzt
Blog/Industry/Call Deflection: Was es ist, wie man sie misst und wie KI sie richtig umsetzt

Kurzfassung

  • Call Deflection bedeutet, eine Kundenanfrage über Self-Service oder Automatisierung zu lösen, sodass gar kein Live-Agent mehr nötig ist. Das entscheidende Wort ist lösen, nicht blockieren. Sie beseitigen den Grund für den Anruf, statt den Kunden nur vom Telefon fernzuhalten.
  • Gemessen wird das mit der Deflection Rate: dem Anteil der Anfragen, die ohne menschliche Unterstützung bearbeitet werden. Die Formel und ein Rechenbeispiel finden Sie unten.
  • Richtig umgesetzt, zahlt es sich aus. McKinsey kommt zu dem Ergebnis, dass digitaler Self-Service Anrufvolumen und Betriebskosten um 25 bis 30 % senken kann (McKinsey).
  • Falsch umgesetzt, schlägt es ins Gegenteil um. Ein Kunde, der in einer Sackgassen-FAQ landet oder an einen Bot gerät, der ihn nicht versteht, wurde nicht deflected, sondern nur vertröstet, und kommt langsamer und verärgerter zurück.
  • AI verändert die Rechnung, weil ein fundierter Assistent deutlich mehr löst als eine statische FAQ oder ein Telefonmenü – in den eigenen Worten des Kunden und sofort.

Bei Deflection geht es nicht darum, den Anruf wegzunehmen. Es geht darum, den Anruf überflüssig zu machen.

„Call Deflection“ klingt nach einem Trick zur Kostensenkung, und wenn es auch so behandelt wird, verdient es seinen schlechten Ruf: das Labyrinth aus Menüs, der Chatbot in der Endlosschleife, das Help Center, das nie die richtige Antwort parat hat. Aber echte Deflection bedeutet nicht, Kunden auszuweichen. Es geht darum, ihr Problem so schnell und so früh zu lösen, dass sie gar nicht erst auf einen Agenten warten müssen. In diesem Leitfaden geht es darum, was Call Deflection tatsächlich ist, wie man sie misst, warum die faule Version nach hinten losgeht und wie AI sie endlich zum Funktionieren bringt – basierend auf dem, was wir bei Invent jeden Tag sehen.

Was ist Call Deflection?

Call Deflection ist die Praxis, Kundenanfragen über Self-Service- oder automatisierte Kanäle zu lösen – etwa eine Wissensdatenbank, einen Chatbot, einen AI-Assistenten oder ein IVR-Menü – sodass sie ohne Live-Agent bearbeitet werden.

Der Begriff stammt aus Call Centern, aber das Prinzip gilt für jeden Kanal. „Ticket Deflection“ und „Chat Deflection“ meinen dasselbe: Ein Kontakt wurde deflected, wenn der Kunde seine Antwort selbst erhält und nicht zu einer Person eskalieren muss.

Das wichtigste Wort ist gelöst. Einen Anruf auf eine Webseite umzuleiten, ist keine Deflection, wenn der Kunde dort keine Antwort findet. Deflection zählt nur dann, wenn das Anliegen tatsächlich ohne menschliche Hilfe gelöst wurde. Wer diesen Unterschied übersieht, optimiert am Ende auf „vermiedene Anrufe“ statt auf „unterstützte Kunden“ – und genau so bekommt Deflection ihren schlechten Ruf.

So messen Sie sie: Deflection Rate

Die Deflection Rate ist der prozentuale Anteil der Kundenanfragen, die über Self-Service und ohne Live-Agent gelöst werden. Die einfache Version:

Deflection Rate (%) = (Self-Service-Lösungen / Gesamtzahl der Anfragen) × 100

Ein Rechenbeispiel: Wenn Sie in einem Monat 1.000 Anfragen erhalten und 200 davon vollständig über Self-Service gelöst werden, beträgt Ihre Deflection Rate (200 / 1.000) × 100 = 20 %.

Die Falle besteht darin, das Falsche zu zählen. Wenn ein Kunde Ihre FAQ liest und danach trotzdem anruft, wurde dieser Kontakt nicht deflected, sondern nur verzögert. Eine aussagekräftige Deflection Rate zählt nur Anfragen, bei denen der Kunde seine Antwort erhalten und keine weitere Aktion unternommen hat. Beobachten Sie sie daher zusammen mit Wiederholungskontakten und Eskalationen nach der Deflection – sie zeigen Ihnen, ob Sie wirklich deflected oder nur ausgewichen sind.

Was Zielwerte betrifft: Viele Teams betrachten 40 % und mehr als eine gesunde Deflection Rate, und gut fundierter Self-Service kann deutlich höher liegen. Aber die Zahl sagt nur dann etwas aus, wenn diese deflected Kunden ihr Anliegen tatsächlich gelöst bekommen haben. Eine Deflection Rate von 70 %, die auf einem Bot basiert, der Menschen frustriert, ist schlechter als eine Rate von 40 %, die wirklich hilft.

Eine Grafik mit dem Titel „How to measure call deflection“, die die Formel zeigt: Deflection Rate entspricht Self-Service-Lösungen geteilt durch Gesamtzahl der Anfragen mal 100, mit einem Rechenbeispiel von 200 Self-Service-Lösungen bei 1.000 Anfragen gleich 20 Prozent, sowie dem Hinweis, nur dann zu zählen, wenn der Kunde sich innerhalb von 48 Stunden nicht erneut meldet.

Die Deflection Rate ist einfach zu berechnen, aber zählen Sie einen Kontakt nur dann als deflected, wenn das Anliegen des Kunden tatsächlich gelöst wurde und keine Rückfrage erfolgte.

Warum schlechte Deflection nach hinten losgeht

Hier kommt der Teil, den die meisten Artikel über „Call Deflection“ auslassen. Wenn Deflection rein als Hebel zur Kostensenkung betrachtet wird, entstehen genau die Erlebnisse, die alle hassen: das Telefonmenü, das die gesuchte Option vergräbt, der Chatbot, der eine andere Frage beantwortet, oder das „War das hilfreich?“ unter einem Artikel, der es nicht war.

Dieser Kunde wurde nicht deflected. Er wurde nur vertröstet. Er kommt wieder – nach zehn verschwendeten Minuten – und ist frustrierter, als wenn er von Anfang an eine Person erreicht hätte. Sie haben keinen Kontakt eingespart, sondern einen schlechteren erzeugt und nach hinten verschoben. Mit der Zeit treibt Deflection auf diese Weise unbemerkt die Abwanderung nach oben, während sie im Dashboard gut aussieht.

Echte Deflection bewirkt das Gegenteil. Wenn ein Kunde über Self-Service schnell die richtige Antwort bekommt, steigt die Zufriedenheit statt zu sinken, denn die meisten Menschen lösen ein einfaches Problem lieber in dreißig Sekunden, als in einer Warteschlange zu hängen. Der Test ist einfach: Kam der Kunde zurück? Wenn Wiederholungskontakte und Eskalationen steigen, während auch Ihre Deflection Rate steigt, dann deflecten Sie nicht. Sie verstecken nur die Warteschlange.

Für dieses Scheitern gibt es einen Namen: Phantom Resolution. Ein Kontakt wird als „gelöst“ markiert, aber der Kunde meldet sich innerhalb von 48 Stunden wegen desselben Problems erneut. Es wurde nie gelöst. Die Warteschlange war nur einen Tag lang versteckt. Messen Sie das also: Verfolgen Sie Ihre Phantom-Resolution-Rate (erneute Kontakte innerhalb von 48 Stunden geteilt durch von AI gelöste Gespräche) direkt neben Ihrer Deflection Rate. Eine Deflection, die hält, ist der echte Gewinn. Eine, die zurückkommt, ist ein Kontakt, für den Sie doppelt bezahlt haben.

Ein Vergleich mit dem Titel „Two kinds of deflection“. Schlechte Deflection: Der Kunde durchläuft eine Menüschleife und eine Sackgassen-FAQ, wird frustriert und ruft trotzdem an, gekennzeichnet als „deferred not deflected“, ein Kontakt, für den Sie doppelt bezahlt haben. Gute Deflection: Der Kunde erreicht einen AI-Assistenten, bekommt sein Anliegen in Sekunden gelöst und ist fertig, gekennzeichnet als „resolved“, eine Deflection, die hält.

Schlechte Deflection verschiebt das Problem, und der Kunde kommt zurück. Gute Deflection löst es, sodass sie Bestand hat.

Wie AI durch tatsächliche Lösung deflected

Der Grund, warum Deflection bisher so unzuverlässig war, ist, dass die alten Tools nur eine schmale Bandbreite an Fragen abdecken konnten. Eine statische FAQ beantwortet nur das, was sie eben enthält. Ein Entscheidungsbaum-Bot verarbeitet genau die Pfade, die jemand vorgegeben hat. Ein IVR-Menü deflected „Wie sind Ihre Öffnungszeiten?“ und frustriert alles andere. Alles außerhalb des Skripts landet bei einem Agenten – oder schlimmer noch – in einer Schleife.

Ein fundierter AI-Assistent erweitert den Bereich dessen, was deflected werden kann, weil er zwei Dinge tut, zu denen die alten Tools nicht in der Lage waren:

  • Er versteht die Frage. Der Kunde tippt oder spricht in seinen eigenen Worten und in seiner eigenen Sprache, und der Assistent erkennt, was tatsächlich gebraucht wird, statt ihn durch ein Menü zu zwingen.
  • Er antwortet auf Basis Ihrer echten Daten. Flexible Fragen werden aus Ihrer Wissensdatenbank beantwortet; präzise Fragen – Bestellstatus, Abrechnung, Verfügbarkeit – kommen aus Live-Aktionen, nicht aus Vermutungen. So löst er das Anliegen, statt nur auf eine Seite zu verweisen und zu hoffen.

Das ist der Unterschied zwischen Deflection, die löst, und Deflection, die ausweicht. McKinsey schätzt, dass bereits 30 bis 50 % des Kontaktvolumens auf Self-Service verlagert werden können (McKinsey); ein gut gebauter AI-Assistent hebt diese Obergrenze weiter an, weil er tatsächlich auch die komplexe Mitte abdecken kann und nicht nur die einfachsten Fragen. Und wenn wirklich ein Mensch nötig ist, übergibt er sauber mit dem vollständigen Kontext, sodass der Kunde nicht wieder von vorne anfangen muss.

Ein Invent-Chat für den Online-Store Lux Boutique: Der Kunde fragt, ob er ein vor zwei Wochen gekauftes Kleid zurückgeben kann und wie das funktioniert, und der AI-Assistent löst die Anfrage anhand seiner Wissensdatenbank, bestätigt das 30-Tage-Rückgabefenster und listet die Rückgabeschritte auf – ganz ohne Agent.

Echte Deflection: Der Assistent löst die Anfrage End-to-End aus seiner Wissensdatenbank, sodass der Kunde weder einen Agenten noch Wartezeit braucht.

So verbessern Sie Ihre Deflection Rate

Wenn Sie mehr Kontakte ohne Agent und zugleich gut gelöst bekommen möchten, sind einige Maßnahmen wichtiger als alle anderen:

  • Gehen Sie von Ihrem tatsächlichen Volumen aus. Ziehen Sie Ihre häufigsten Anfragen heran und identifizieren Sie diejenigen, die sich wiederholen und beantwortbar sind: Bestellstatus, Öffnungszeiten, Rückgaben, Passwort-Resets, grundlegende Anleitungen. Das sind Ihre wertvollsten Deflection-Ziele, nicht die seltenen Sonderfälle.
  • Fundieren Sie die Antworten. Self-Service deflected nur dann, wenn er korrekt ist. Verbinden Sie Ihre Wissensdatenbank und die Live-Daten, die der Assistent braucht – Bestellungen, Buchungen, Konten –, damit er lösen statt raten kann.
  • Machen Sie ihn leicht auffindbar und leicht nutzbar. Platzieren Sie Self-Service dort, wo die Frage tatsächlich entsteht – auf der Seite, im Chat, vor dem Anruf – und lassen Sie Menschen in ihren eigenen Worten fragen, statt sie durch Menüs suchen zu lassen.
  • Messen Sie Lösung, nicht nur Deflection. Beobachten Sie Wiederholungskontakte und Eskalationen nach der Deflection. Wenn sie gemeinsam mit Ihrer Deflection Rate steigen, vertrösten Sie nur, statt zu deflecten. Schließen Sie die Lücken, die Ihnen die Daten zeigen.
  • Leiten Sie den Rest sauber weiter. Manche Kontakte sollten eine Person erreichen. Sorgen Sie dafür, dass diese Übergabe schnell erfolgt und reich an Kontext ist, damit sich auch die Fälle, die Sie nicht deflecten, gut anfühlen.

Woran wir bei Invent arbeiten

Bei Invent entwickeln wir AI-Assistenten, die durch Lösen deflecten, nicht durch Blockieren.

  • Fundiert in Ihren Daten. Antworten kommen aus Ihrer Wissensdatenbank und aus Live-Aktionen, sodass der Assistent das Anliegen löst, statt nur auf eine Seite zu verweisen.
  • In den Worten und der Sprache des Kunden. Keine Menüs zur Navigation, kein Fallback nur auf Englisch – der Kunde fragt natürlich und bekommt eine echte Antwort.
  • Auf jedem Kanal, an einem Ort. Chat, Web, WhatsApp und mehr – damit Deflection dort stattfindet, wo der Kunde ohnehin schon ist.
  • Saubere Übergabe, wenn nötig. Wenn eine Frage wirklich eine Person erfordert, übergibt der Assistent sie mit vollständigem Kontext, sodass nichts verloren geht und niemand sich wiederholen muss.

Das Ziel ist nie, Kunden vom Telefon fernzuhalten. Es ist, das Telefon überflüssig zu machen – und dafür zu sorgen, dass sie froh darüber sind.

Das Fazit

Call Deflection ist ein guter Begriff, wenn er bedeutet: „Wir haben es gelöst, bevor Sie warten mussten“, und ein schlechter, wenn er bedeutet: „Wir haben Sie aus der Warteschlange herausgehalten.“ Der Unterschied liegt darin, ob das Problem des Kunden tatsächlich gelöst wurde. Messen Sie die Deflection Rate, aber behalten Sie Lösung und Wiederholungskontakte direkt daneben im Blick, und bauen Sie Self-Service, der Antworten liefert, statt um seiner selbst willen zu deflecten.

Bei Deflection geht es nicht darum, den Anruf wegzunehmen. Es geht darum, den Anruf überflüssig zu machen.

FAQs

Was ist Call Deflection?

Call Deflection bedeutet, Kundenanfragen über Self-Service oder automatisierte Kanäle wie eine Wissensdatenbank, einen Chatbot, einen AI-Assistenten oder IVR zu lösen, sodass sie ohne Live-Agent bearbeitet werden. Ein Kontakt zählt nur dann als deflected, wenn der Kunde seine Antwort tatsächlich erhalten hat und nicht zu einer Person eskalieren musste.

Was ist die Deflection Rate und wie wird sie berechnet?

Die Deflection Rate ist der prozentuale Anteil der Anfragen, die ohne menschlichen Agenten gelöst werden. Die einfache Formel lautet: (Self-Service-Lösungen / Gesamtzahl der Anfragen) × 100. Zum Beispiel entsprechen 200 Self-Service-Lösungen bei 1.000 Anfragen einer Deflection Rate von 20 %. Für eine genaue Messung sollten Sie nur Anfragen zählen, bei denen der Kunde sich anschließend nicht erneut an einen Live-Kontakt gewandt hat.

Was ist eine gute Call-Deflection-Rate?

Viele Teams streben 40 % und mehr an, und gut fundierter Self-Service kann deutlich darüber liegen. Aber die Rate ist nur dann aussagekräftig, wenn diese Kunden ihr Anliegen tatsächlich gelöst bekommen haben. Eine hohe Deflection Rate, die auf einem frustrierenden Bot basiert, ist schlechter als eine niedrigere Rate, die wirklich hilft. Verfolgen Sie daher Lösung und Wiederholungskontakte parallel dazu.

Was ist der Unterschied zwischen Call Deflection und Ticket Deflection?

Es ist dieselbe Idee auf unterschiedlichen Kanälen. Call Deflection bezieht sich auf Telefonanrufe, Ticket Deflection auf E-Mail- oder Helpdesk-Tickets und Chat Deflection auf Live-Chat. In jedem Fall ist ein Kontakt deflected, wenn der Kunde sein Anliegen über Self-Service statt über einen Live-Agent löst.

Verschlechtert Call Deflection das Kundenerlebnis?

Nur wenn sie schlecht umgesetzt wird. Deflection, die Kunden in Sackgassen-Menüs oder an Bots führt, die sie nicht verstehen, erhöht Frustration und Abwanderung. Deflection, die über Self-Service schnell die richtige Antwort liefert, verbessert dagegen die Zufriedenheit, weil die meisten Menschen ein einfaches Problem lieber in Sekunden lösen, als in einer Warteschlange zu warten.

Wie verbessert AI die Call Deflection?

Ein fundierter AI-Assistent versteht die Frage des Kunden in dessen eigenen Worten und antwortet auf Basis Ihrer echten Daten – Ihrer Wissensdatenbank bei offenen Fragen und Live-Aktionen bei präzisen Anliegen wie Bestellstatus oder Abrechnung. So kann er ein viel breiteres Spektrum an Problemen lösen als eine statische FAQ oder ein Entscheidungsbaum-Bot und sauber an einen Menschen übergeben, wenn ein Kontakt dies wirklich erfordert.

Ähnlich

Deflection bekommt ihren schlechten Ruf nur dann, wenn sie ausweicht. Bauen Sie Self-Service, der löst, und „Deflection“ wird zu dem Moment, in dem einem Kunden geholfen wurde, noch bevor er überhaupt warten musste.

Erstellen Sie Ihren Assistenten kostenlos

Keine Kreditkarte erforderlich.

Weiterlesen

Jeder schweigende Kunde ist ein verlorener Abschluss. So haben wir das gelöst.
Product

Jeder schweigende Kunde ist ein verlorener Abschluss. So haben wir das gelöst.

Die meisten abgebrochenen Gespräche werden nie wieder aufgenommen. Die Auto Follow-ups von Invent ändern das: Sie machen aus stillen Absprüngen automatisch abgeschlossene Deals.

Arshad Yaseen
Arshad Yaseen
May 26, 26
Live-Chat-Begrüßungsnachrichten: Über 30 Beispiele (plus AI-Upgrade)
Industry

Live-Chat-Begrüßungsnachrichten: Über 30 Beispiele (plus AI-Upgrade)

Beispiele und Vorlagen für Live-Chat-Begrüßungsnachrichten nach Branche und Einsatzszenario – plus Timing-Regeln und wie ein AI-Assistent die Begrüßung in jeder Sprache personalisiert.

Alix Gallardo
Alix Gallardo
May 26, 26
Wie viele Sprachen unterstützt ChatGPT wirklich? Die ehrliche Antwort
Industry

Wie viele Sprachen unterstützt ChatGPT wirklich? Die ehrliche Antwort

Wie viele Sprachen unterstützt ChatGPT wirklich? Die ehrliche Antwort, wie Gemini, Claude und Grok im Vergleich abschneiden und warum nicht die Anzahl, sondern die Qualität pro Sprache entscheidend ist.

Alix Gallardo
Alix Gallardo
May 25, 26
Customer Support vs. Customer Service – und wie KI beides verändert
Industry

Customer Support vs. Customer Service – und wie KI beides verändert

Customer Support vs. Customer Service: klare Definitionen, ein direkter Vergleich, die wichtigsten Kennzahlen, die Übergabe zwischen beiden Teams – und wie KI beide Bereiche neu prägt.

Alix Gallardo
Alix Gallardo
May 25, 26
#020: Human-Only-Modus & Gemini 3.5 Flash-Modelle
Changelog

#020: Human-Only-Modus & Gemini 3.5 Flash-Modelle

Invent #020: Der neue Human-Only-Modus ermöglicht es Ihnen, AI-Antworten zu deaktivieren und den VIP-Support vollständig menschlich zu halten. Zusätzlich sorgen Gemini 3.5 Flash-Modelle für schnellere und intelligentere AI-Gespräche.

Alix Gallardo
Alix Gallardo
May 22, 26
Wie KI das Kundenerlebnis personalisiert: Was wirklich funktioniert – und was nur Hype ist
Industry

Wie KI das Kundenerlebnis personalisiert: Was wirklich funktioniert – und was nur Hype ist

KI-gestützte Personalisierung im Kundenerlebnis: wo sie heute tatsächlich funktioniert, was noch reiner Hype ist und welche Entscheidungen zu Daten, Governance und Vertrauen jedes Unternehmen treffen muss.

Alix Gallardo
Alix Gallardo
May 22, 26