Call Deflection: Was dahintersteckt und wie man sie misst

Zuletzt aktualisiert: Juli 2026

Kurzfassung

Call Deflection bedeutet, die Anfrage eines Kunden über Self-Service oder Automatisierung zu lösen, sodass nie ein Live-Agent nötig wird. Das entscheidende Wort ist lösen, nicht abblocken. Sie beseitigen den Grund für den Anruf, statt den Kunden nur vom Telefon fernzuhalten.
Gemessen wird das mit der Deflection Rate: dem Anteil der Anfragen, die ohne menschliche Unterstützung bearbeitet werden. Die Formel und ein Rechenbeispiel finden Sie unten.
Richtig umgesetzt, zahlt es sich aus. McKinsey kommt zu dem Ergebnis, dass digitaler Self-Service das Anrufvolumen und die Betriebskosten um 25 bis 30 % senken kann (McKinsey).
Schlecht umgesetzt, geht es nach hinten los. Ein Kunde, der in einer Sackgassen-FAQ landet oder auf einen Bot trifft, der ihn nicht versteht, wurde nicht deflected, sondern nur vertröstet, und kommt später langsamer und verärgerter zurück.
AI verändert die Gleichung, weil ein fundierter Assistent deutlich mehr Anfragen löst als eine statische FAQ oder ein Telefonmenü — sofort und in den eigenen Worten des Kunden.

Bei Deflection geht es nicht darum, den Anruf wegzunehmen. Es geht darum, den Anruf überflüssig zu machen.

„Call Deflection“ klingt nach einem Trick zur Kostensenkung, und wenn es auch so behandelt wird, verdient es seinen schlechten Ruf: das Labyrinth aus Menüs, der Chatbot, der sich im Kreis dreht, das Help Center, das nie die richtige Antwort hat. Aber echte Deflection bedeutet nicht, Kunden auszuweichen. Es geht darum, ihr Problem so schnell und so früh zu lösen, dass sie gar nicht erst auf einen Agenten warten müssen. In diesem Leitfaden erklären wir, was Call Deflection tatsächlich ist, wie man sie misst, warum die bequeme Variante nach hinten losgeht und wie AI sie endlich zum Funktionieren bringt — basierend auf dem, was wir jeden Tag bei Invent sehen.

Was ist Call Deflection?

Call Deflection bezeichnet die Praxis, Kundenanfragen über Self-Service- oder automatisierte Kanäle zu lösen — etwa über eine Wissensdatenbank, einen Chatbot, einen AI-Assistenten oder ein IVR-Menü — sodass sie ohne Live-Agent bearbeitet werden.

Der Begriff stammt aus Call Centern, aber das Prinzip gilt für jeden Kanal. „Ticket Deflection“ und „Chat Deflection“ sind dasselbe Konzept: Ein Kontakt gilt als deflected, wenn der Kunde seine Antwort selbst erhält und nicht an eine Person eskalieren muss.

Das wichtigste Wort ist gelöst. Eine Weiterleitung von einem Anruf auf eine Webseite ist keine Deflection, wenn der Kunde dort die Antwort nicht findet. Als Deflection zählt es nur, wenn das Anliegen tatsächlich ohne menschliche Hilfe gelöst wird. Wird dieser Unterschied übersehen, optimiert man am Ende auf „vermiedene Anrufe“ statt auf „geholfene Kunden“ — und genau so bekommt Deflection ihren schlechten Ruf.

So messen Sie sie: Deflection Rate

Die Deflection Rate ist der Prozentsatz der Kundenanfragen, die über Self-Service ohne Live-Agent gelöst werden. Die einfache Version:

Deflection Rate (%) = (Self-Service-Lösungen / Gesamtzahl der Anfragen) × 100

Ein Rechenbeispiel: Wenn Sie in einem Monat 1.000 Anfragen erhalten und 200 davon vollständig über Self-Service gelöst werden, beträgt Ihre Deflection Rate (200 / 1.000) × 100 = 20 %.

Die Falle besteht darin, das Falsche zu zählen. Wenn ein Kunde Ihre FAQ liest und danach trotzdem anruft, wurde dieser Kontakt nicht deflected, sondern nur verzögert. Eine aussagekräftige Deflection Rate zählt nur Anfragen, bei denen der Kunde seine Antwort erhalten hat und keine weitere Aktion nötig war. Verfolgen Sie sie daher zusammen mit Wiederholungskontakten und Eskalationen nach Deflection — diese zeigen, ob Sie wirklich deflected oder nur ausgewichen sind.

Was Zielwerte angeht: Viele Teams betrachten 40 % und mehr als eine gesunde Deflection Rate, und gut fundierter Self-Service kann deutlich höher liegen. Aber die Zahl bedeutet nur dann etwas, wenn diese deflected Kunden ihr Anliegen tatsächlich gelöst bekommen haben. Eine Deflection Rate von 70 %, die auf einem Bot basiert, der Menschen frustriert, ist schlechter als 40 %, die wirklich helfen.

Eine Grafik mit dem Titel „How to measure call deflection“, die die Formel zeigt: Deflection Rate = Self-Service-Lösungen geteilt durch Gesamtzahl der Anfragen mal 100, mit einem Rechenbeispiel von 200 Self-Service-Lösungen bei 1.000 Anfragen gleich 20 Prozent, sowie dem Hinweis, nur dann zu zählen, wenn der Kunde sich nicht innerhalb von 48 Stunden erneut meldet.

Die Deflection Rate ist leicht zu berechnen, aber zählen Sie einen Kontakt nur dann als deflected, wenn das Anliegen des Kunden tatsächlich gelöst wurde und keine Rückfrage mehr kam.

Warum schlechte Deflection nach hinten losgeht

Hier kommt der Teil, den die meisten Artikel über „Call Deflection“ auslassen. Wenn Deflection rein als Kostenhebel behandelt wird, entstehen genau die Erlebnisse, die alle hassen: das Sprachmenü, in dem die benötigte Option vergraben ist, der Chatbot, der eine andere Frage beantwortet, oder das „War das hilfreich?“ unter einem Artikel, der es nicht war.

Dieser Kunde wurde nicht deflected. Er wurde nur vertröstet. Er wird wiederkommen — nach zehn vergeudeten Minuten und frustrierter, als wenn er von Anfang an eine Person erreicht hätte. Sie haben keinen Kontakt eingespart, sondern einen schlechteren erzeugt und nur nach hinten verschoben. Auf Dauer ist das der Weg, wie Deflection still und leise die Abwanderung erhöht und dabei im Dashboard gut aussieht.

Echte Deflection bewirkt das Gegenteil. Wenn ein Kunde über Self-Service schnell die richtige Antwort bekommt, steigt die Zufriedenheit statt zu sinken, denn die meisten Menschen lösen ein einfaches Problem lieber in dreißig Sekunden, als in einer Warteschlange zu hängen. Der Test ist einfach: Kam der Kunde zurück? Wenn Wiederholungskontakte und Eskalationen steigen, während auch Ihre Deflection Rate steigt, dann deflecten Sie nicht. Sie verstecken nur die Warteschlange.

Für dieses Scheitern gibt es einen Namen: Phantom Resolution. Ein Kontakt wird als „gelöst“ markiert, aber der Kunde meldet sich innerhalb von 48 Stunden wegen desselben Problems erneut. Dann war es nie wirklich gelöst. Die Warteschlange wurde nur für einen Tag versteckt. Messen Sie das also: Verfolgen Sie Ihre Phantom-Resolution-Rate (erneute Kontakte innerhalb von 48 Stunden geteilt durch von AI gelöste Gespräche) direkt neben Ihrer Deflection Rate. Eine Deflection, die Bestand hat, ist der echte Gewinn. Eine, die zurückkommt, ist ein Kontakt, für den Sie doppelt bezahlt haben.

Ein Vergleich mit dem Titel „Two kinds of deflection“. Schlechte Deflection: Der Kunde durchläuft eine Menüschleife und eine Sackgassen-FAQ, wird frustriert und ruft trotzdem an, gekennzeichnet als „deferred not deflected“, ein Kontakt, für den Sie doppelt bezahlt haben. Gute Deflection: Der Kunde erreicht einen AI-Assistenten, bekommt in Sekunden eine Lösung und ist fertig, gekennzeichnet als „resolved“, eine Deflection, die Bestand hat.

Schlechte Deflection verschiebt das Problem nur, und der Kunde kommt zurück. Gute Deflection löst es, sodass sie Bestand hat.

Wie AI durch tatsächliche Lösung deflectet

Der Grund, warum Deflection bisher so unzuverlässig war, ist, dass die alten Tools nur eine kleine Bandbreite an Fragen abdecken konnten. Eine statische FAQ beantwortet nur das, was zufällig enthalten ist. Ein Bot mit Entscheidungsbaum verarbeitet nur exakt die Pfade, die jemand vorher festgelegt hat. Ein IVR-Menü deflectet Fragen wie „Wie sind Ihre Öffnungszeiten?“ und frustriert bei allem anderen. Alles außerhalb des Skripts landet bei einem Agenten — oder schlimmer noch — in einer Schleife.

Ein fundierter AI-Assistent erweitert den Bereich dessen, was deflected werden kann, weil er zwei Dinge tut, die die alten Tools nicht konnten:

Er versteht die Frage. Der Kunde tippt oder spricht in seinen eigenen Worten, in seiner eigenen Sprache, und der Assistent erkennt, was er tatsächlich braucht, statt ihn durch ein Menü zu zwingen.
Er antwortet auf Basis Ihrer echten Daten. Flexible Fragen werden aus Ihrer Wissensdatenbank beantwortet; konkrete Fragen — Bestellstatus, Rechnungen, Verfügbarkeit — kommen aus Live-Aktionen, nicht aus Vermutungen. So löst er das Anliegen, statt nur auf eine Seite zu verweisen und zu hoffen.

Das ist der Unterschied zwischen Deflection, die löst, und Deflection, die ausweicht. McKinsey schätzt, dass bereits 30 bis 50 % des Kontaktvolumens in den Self-Service verlagert werden können (McKinsey); ein gut gebauter AI-Assistent hebt diese Obergrenze weiter an, weil er tatsächlich den schwierigen Mittelbereich abdecken kann und nicht nur die einfachsten Fragen. Und wenn wirklich ein Mensch nötig ist, übergibt er sauber mit dem vollständigen Kontext, sodass der Kunde nicht wieder bei null anfangen muss.

Ein Invent-Chat für den Online-Shop Lux Boutique: Der Kunde fragt, ob er ein vor zwei Wochen gekauftes Kleid zurückgeben kann und wie das funktioniert, und der AI-Assistent löst die Anfrage aus seiner Wissensdatenbank, bestätigt das 30-Tage-Rückgabefenster und listet die Rückgabeschritte auf — ganz ohne Agenten.

Echte Deflection: Der Assistent löst die Anfrage von Anfang bis Ende aus der Wissensdatenbank, sodass der Kunde weder einen Agenten noch Wartezeit braucht.

So verbessern Sie Ihre Deflection Rate

Wenn Sie möchten, dass mehr Kontakte ohne Agent gelöst werden — und zwar gut — sind einige Maßnahmen wichtiger als alle anderen:

Beginnen Sie mit Ihrem tatsächlichen Volumen. Ziehen Sie Ihre häufigsten Anfragen heran und identifizieren Sie diejenigen, die sich wiederholen und gut beantwortbar sind: Bestellstatus, Öffnungszeiten, Rückgaben, Passwort-Resets, einfache Anleitungen. Das sind Ihre wertvollsten Ziele für Deflection, nicht die seltenen Sonderfälle.
Fundieren Sie die Antworten. Self-Service deflectet nur dann, wenn er korrekt ist. Verbinden Sie Ihre Wissensdatenbank und die Live-Daten, die der Assistent braucht — Bestellungen, Buchungen, Konten — damit er lösen statt raten kann.
Machen Sie den Zugang einfach und die Nutzung leicht. Platzieren Sie Self-Service dort, wo die Frage tatsächlich entsteht — auf der Seite, im Chat, vor dem Anruf — und lassen Sie Menschen in ihren eigenen Worten fragen, statt sich durch Menüs zu kämpfen.
Messen Sie Lösungen, nicht nur Deflection. Beobachten Sie Wiederholungskontakte und Eskalationen nach Deflection. Wenn sie zusammen mit Ihrer Deflection Rate steigen, vertrösten Sie nur, statt wirklich zu deflecten. Schließen Sie die Lücken, die die Daten sichtbar machen.
Leiten Sie den Rest sauber weiter. Manche Kontakte sollten eine Person erreichen. Sorgen Sie dafür, dass diese Übergabe schnell erfolgt und alle relevanten Informationen enthält, damit sich auch die Fälle, die Sie nicht deflecten, gut anfühlen.

Woran wir bei Invent bauen

Bei Invent bauen wir AI-Assistenten, die durch Lösen deflecten, nicht durch Blockieren.

Fundiert auf Ihren Daten. Antworten kommen aus Ihrer Wissensdatenbank und aus Live-Aktionen, sodass der Assistent das Anliegen löst, statt nur auf eine Seite zu verweisen.
In den Worten und der Sprache des Kunden. Keine Menüs zum Durchklicken, kein Fallback nur auf Englisch — der Kunde fragt natürlich und bekommt eine echte Antwort.
Auf jedem Kanal, an einem Ort. Chat, Web, WhatsApp und mehr — damit Deflection überall dort stattfindet, wo der Kunde ohnehin schon ist.
Saubere Übergabe, wenn nötig. Wenn eine Frage wirklich eine Person braucht, übergibt der Assistent sie mit vollem Kontext, sodass nichts verloren geht und niemand sich wiederholen muss.

Das Ziel ist nie, Kunden vom Telefon fernzuhalten. Das Ziel ist, das Telefon überflüssig zu machen — und dafür zu sorgen, dass sie froh darüber sind.

Das Fazit

Call Deflection ist ein guter Begriff, wenn er bedeutet: „Wir haben es gelöst, bevor Sie warten mussten“, und ein schlechter, wenn er bedeutet: „Wir haben Sie aus der Warteschlange herausgehalten.“ Der Unterschied liegt darin, ob das Problem des Kunden tatsächlich gelöst wurde. Messen Sie die Deflection Rate, aber behalten Sie Lösungserfolg und Wiederholungskontakte direkt daneben im Blick, und bauen Sie Self-Service, der Antworten gibt, statt um seiner selbst willen zu deflecten.

Bei Deflection geht es nicht darum, den Anruf wegzunehmen. Es geht darum, den Anruf überflüssig zu machen.

FAQs

Was ist Call Deflection?

Call Deflection bedeutet, Kundenanfragen über Self-Service oder automatisierte Kanäle zu lösen — etwa über eine Wissensdatenbank, einen Chatbot, einen AI-Assistenten oder ein IVR — sodass sie ohne Live-Agent bearbeitet werden. Ein Kontakt zählt nur dann als deflected, wenn der Kunde seine Antwort tatsächlich erhalten hat und nicht an eine Person eskalieren musste.

Was ist die Deflection Rate und wie wird sie berechnet?

Die Deflection Rate ist der Prozentsatz der Anfragen, die ohne menschlichen Agenten gelöst werden. Die einfache Formel lautet: (Self-Service-Lösungen / Gesamtzahl der Anfragen) × 100. Beispiel: 200 Self-Service-Lösungen bei 1.000 Anfragen ergeben eine Deflection Rate von 20 %. Für genaue Werte sollten nur Anfragen gezählt werden, bei denen der Kunde danach keinen weiteren Live-Kontakt benötigt hat.

Was ist eine gute Call Deflection Rate?

Viele Teams streben 40 % und mehr an, und gut fundierter Self-Service kann deutlich höher liegen. Aber die Rate ist nur dann relevant, wenn diese Kunden ihr Anliegen tatsächlich gelöst bekommen haben. Eine hohe Deflection Rate, die auf einem frustrierenden Bot basiert, ist schlechter als eine niedrigere Rate, die wirklich hilft. Behalten Sie deshalb Lösungserfolg und Wiederholungskontakte parallel im Blick.

Was ist der Unterschied zwischen Call Deflection und Ticket Deflection?

Es ist dieselbe Idee auf unterschiedlichen Kanälen. Call Deflection bezieht sich auf Telefonanrufe; Ticket Deflection auf E-Mail- oder Helpdesk-Tickets; Chat Deflection auf Live-Chat. In jedem Fall gilt ein Kontakt als deflected, wenn der Kunde sein Problem über Self-Service statt über einen Live-Agent löst.

Beeinträchtigt Call Deflection das Kundenerlebnis?

Nur wenn sie schlecht umgesetzt ist. Deflection, die Kunden in Sackgassen-Menüs oder zu Bots führt, die sie nicht verstehen, erhöht Frust und Abwanderung. Deflection, die über Self-Service schnell die richtige Antwort liefert, verbessert die Zufriedenheit, weil die meisten Menschen ein einfaches Anliegen lieber in Sekunden lösen, als in einer Warteschlange zu warten.

Wie verbessert AI Call Deflection?

Ein fundierter AI-Assistent versteht die Frage des Kunden in dessen eigenen Worten und antwortet auf Basis Ihrer echten Daten — Ihrer Wissensdatenbank für flexible Fragen und Live-Aktionen für konkrete Themen wie Bestellstatus oder Rechnungen. Dadurch kann er eine viel größere Bandbreite an Anliegen lösen als eine statische FAQ oder ein Entscheidungsbaum-Bot und sauber an einen Menschen übergeben, wenn ein Kontakt das wirklich erfordert.

Call Deflection: Was dahintersteckt und wie man sie misst

Kurzfassung

Was ist Call Deflection?

So messen Sie sie: Deflection Rate

Warum schlechte Deflection nach hinten losgeht

Wie AI durch tatsächliche Lösung deflectet

So verbessern Sie Ihre Deflection Rate

Woran wir bei Invent bauen

Das Fazit

FAQs

Was ist Call Deflection?

Was ist die Deflection Rate und wie wird sie berechnet?

Was ist eine gute Call Deflection Rate?

Was ist der Unterschied zwischen Call Deflection und Ticket Deflection?

Beeinträchtigt Call Deflection das Kundenerlebnis?

Wie verbessert AI Call Deflection?

Ähnliche Artikel

Verfasst von

Starte kostenlos mit dem Bau deines Assistenten

Weiterlesen

#027: Segment Actions & Muse Spark 1.1

Meta Business Partner: Was das ist und was es für Sie bedeutet

Airtable vs. Notion vs. Google Sheets für Unternehmen

Mit Conversational AI Website-Traffic in Umsatz verwandeln

#026: WhatsApp-Template-Editor, Invent für Agents & Claude Sonnet 5

Meta Business Agent: Kosten und die Alternative, die Ihnen selbst gehört