Industry

Call Deflection: cos’è, come si misura e come l’AI la rende davvero efficace

Call deflection spiegata in modo chiaro: cos’è, come calcolare il tasso di deflection, perché una deflection fatta male si ritorce contro e come l’AI riduce il volume delle richieste di supporto risolvendo davvero i problemi.

May 26, 2026

Call Deflection: cos’è, come si misura e come l’AI la rende davvero efficace
Blog/Industry/Call Deflection: cos’è, come si misura e come l’AI la rende davvero efficace

In breve

  • Per call deflection si intende la risoluzione della richiesta di un cliente tramite self-service o automazione, così da non rendere mai necessario l’intervento di un operatore umano. La parola chiave è risoluzione, non blocco. Stai eliminando il motivo della chiamata, non semplicemente tenendo il cliente lontano dal telefono.
  • Si misura con il tasso di deflection: la quota di richieste gestite senza intervento umano. La formula e un esempio pratico sono riportati qui sotto.
  • Se fatta bene, porta risultati concreti. McKinsey rileva che il self-service digitale può ridurre il volume delle chiamate e i costi operativi del 25–30% (McKinsey).
  • Se fatta male, si ritorce contro. Un cliente lasciato in una FAQ senza uscita o davanti a un bot che non riesce a capirlo non è stato deflesso, ma rimandato, e tornerà più tardi e più frustrato.
  • L’AI cambia i termini dell’equazione, perché un assistente ben ancorato ai dati risolve molte più richieste di una FAQ statica o di un menu telefonico, all’istante e nelle parole del cliente.

La deflection non consiste nel togliere di mezzo la chiamata. Consiste nel renderla superflua.

"Call deflection" suona come un trucco per tagliare i costi e, quando viene trattata come tale, si guadagna la sua cattiva reputazione: il labirinto di menu, il chatbot che va in loop, il centro assistenza che non ha mai la risposta che ti serve. Ma la vera deflection non consiste nell’evitare i clienti. Consiste nel risolvere il loro problema così rapidamente e così presto da non far mai nascere il bisogno di aspettare un operatore. In questa guida spieghiamo che cos’è davvero la call deflection, come misurarla, perché la versione pigra si ritorce contro e come l’AI riesca finalmente a farla funzionare, sulla base di ciò che vediamo ogni giorno in Invent.

Che cos’è la call deflection?

La call deflection è la pratica di risolvere le richieste dei clienti tramite canali self-service o automatizzati, una knowledge base, un chatbot, un assistente AI, un menu IVR, così che vengano gestite senza un operatore umano.

Il termine nasce nei call center, ma il concetto si applica a ogni canale. "Ticket deflection" e "chat deflection" indicano la stessa idea: un contatto viene deflesso quando il cliente ottiene la risposta in autonomia e non ha bisogno di passare a una persona.

La parola più importante è risolta. Reindirizzare una chiamata a una pagina web non è deflection se il cliente lì non trova la risposta. Si parla di deflection solo quando il problema viene davvero risolto senza intervento umano. Se perdi di vista questa distinzione, finisci per ottimizzare le "chiamate evitate" invece dei "clienti aiutati", ed è esattamente così che la deflection si fa una cattiva fama.

Come si misura: tasso di deflection

Il tasso di deflection è la percentuale di richieste dei clienti risolte tramite self-service, senza un operatore umano. La versione più semplice è:

Tasso di deflection (%) = (risoluzioni via self-service / richieste totali) × 100

Un esempio pratico: se ricevi 1.000 richieste in un mese e 200 vengono risolte completamente tramite self-service, il tuo tasso di deflection è (200 / 1.000) × 100 = 20%.

La trappola è contare la cosa sbagliata. Se un cliente legge la tua FAQ e poi chiama comunque, quel contatto non è stato deflesso, è stato solo ritardato. Un tasso di deflection significativo conta solo le richieste in cui il cliente ha ottenuto la risposta e non ha compiuto ulteriori azioni. Per questo va monitorato insieme ai contatti ripetuti e alle escalation dopo la deflection, che ti dicono se hai davvero deflesso o se hai semplicemente evitato il problema.

Quanto agli obiettivi: molti team considerano sano un tasso di deflection dal 40% in su, e un self-service ben strutturato può salire molto più in alto. Ma quel numero ha senso solo se quei clienti hanno davvero ottenuto una soluzione. Un tasso di deflection del 70% basato su un bot che frustra le persone è peggiore di un 40% che aiuta davvero.

Una grafica intitolata Come misurare la call deflection, che mostra la formula secondo cui il tasso di deflection è uguale alle risoluzioni via self-service divise per il totale delle richieste e moltiplicate per 100, con un esempio pratico di 200 risoluzioni via self-service su 1.000 richieste pari al 20%, e una nota che invita a conteggiarlo solo se il cliente non ha effettuato un follow-up entro 48 ore.

Il tasso di deflection è semplice da calcolare, ma conta un contatto come deflesso solo se il cliente ha davvero ottenuto una soluzione e non ha effettuato un follow-up.

Perché una cattiva deflection si ritorce contro

Ecco la parte che la maggior parte degli articoli sulla "call deflection" salta. Quando la deflection viene trattata solo come una leva per ridurre i costi, produce le esperienze che tutti odiano: l’albero telefonico che nasconde l’opzione di cui hai bisogno, il chatbot che risponde a un’altra domanda, il "Ti è stato utile?" sotto un articolo che non lo era affatto.

Quel cliente non è stato deflesso. È stato rimandato. Tornerà, dopo aver perso dieci minuti, più frustrato di quanto sarebbe stato se avesse parlato subito con una persona. Non hai risparmiato un contatto: ne hai creato uno peggiore e lo hai solo spostato più avanti. Nel tempo, è così che la deflection alimenta silenziosamente il churn mentre continua ad apparire bene in dashboard.

La vera deflection fa l’opposto. Quando un cliente ottiene una risposta rapida e corretta tramite self-service, la soddisfazione aumenta, non diminuisce, perché la maggior parte delle persone preferisce risolvere un problema semplice in trenta secondi piuttosto che aspettare in coda. Il test è semplice: il cliente è tornato? Se i contatti ripetuti e le escalation aumentano insieme al tasso di deflection, non stai deflettendo. Stai nascondendo la coda.

Questo fallimento ha un nome: risoluzione fantasma. Un contatto viene segnato come "risolto", ma il cliente torna entro 48 ore per lo stesso problema. Non è mai stato davvero risolto. La coda è stata solo nascosta per un giorno. Quindi misuralo: monitora il tuo tasso di risoluzione fantasma (ricontatti entro 48 ore divisi per conversazioni risolte dall’AI) accanto al tasso di deflection. Una deflection che regge è una vera vittoria. Una che rimbalza indietro è un contatto che hai pagato due volte.

Un confronto intitolato Due tipi di deflection. Cattiva deflection: il cliente passa attraverso un loop di menu e una FAQ senza uscita, si frustra e chiama comunque, etichettato come rimandato, non deflesso, un contatto che hai pagato due volte. Buona deflection: il cliente raggiunge un assistente AI, ottiene una soluzione in pochi secondi e ha finito, etichettato come risolto, una deflection che regge.

La cattiva deflection rimanda il problema e il cliente torna. La buona deflection lo risolve, quindi regge.

Come l’AI deflette risolvendo davvero

Il motivo per cui la deflection è sempre stata così incostante è che i vecchi strumenti riuscivano a deviare solo una fascia ristretta di domande. Una FAQ statica risponde solo a ciò che copre. Un bot ad albero decisionale gestisce solo i percorsi esatti che qualcuno ha scritto. Un menu IVR devia domande come "quali sono i vostri orari" e frustra tutto il resto. Tutto ciò che esce dallo script finisce a un operatore o, peggio, in un loop.

Un assistente AI ben ancorato ai dati amplia la gamma di ciò che può essere deflesso, perché fa due cose che i vecchi strumenti non potevano fare:

  • Capisce la domanda. Il cliente scrive o parla con le proprie parole, nella propria lingua, e l’assistente capisce di cosa ha davvero bisogno, invece di costringerlo a passare attraverso un menu.
  • Risponde usando i tuoi dati reali. Alle domande flessibili risponde attingendo alla tua knowledge base; per quelle precise, stato dell’ordine, fatturazione, disponibilità, usa azioni in tempo reale, non supposizioni. Così risolve il problema invece di limitarsi a indicare una pagina sperando che basti.

Questa è la differenza tra una deflection che risolve e una che evita. McKinsey stima che il 30–50% del volume dei contatti possa già essere spostato sul self-service (McKinsey); un assistente AI ben costruito alza ulteriormente questo tetto perché riesce davvero a gestire la parte intermedia e complessa, non solo le domande più semplici. E quando serve davvero una persona, passa il caso in modo pulito e con tutto il contesto, così il cliente non deve mai ricominciare da zero.

Una chat di Invent per il negozio online Lux Boutique: il cliente chiede se può restituire un vestito acquistato due settimane prima e come fare, e l’assistente AI risolve la richiesta attingendo alla propria knowledge base, confermando la finestra di reso di 30 giorni e indicando i passaggi per il reso, senza bisogno di un operatore.

Vera deflection: l’assistente risolve la richiesta end-to-end dalla knowledge base, così il cliente non ha mai bisogno di un operatore né di aspettare.

Come migliorare il tuo tasso di deflection

Se vuoi che più contatti vengano risolti senza operatore, e risolti bene, alcune mosse contano più di tutte le altre:

  • Parti dal tuo volume reale. Analizza le richieste più comuni e individua quelle ripetitive e a cui si può rispondere: stato dell’ordine, orari, resi, reimpostazione password, istruzioni di base. Questi sono i target di deflection a più alto valore, non i rari casi limite.
  • Basa le risposte su dati affidabili. Il self-service deflette solo se è corretto. Collega la tua knowledge base e i dati in tempo reale di cui l’assistente ha bisogno, ordini, prenotazioni, account, così può risolvere invece di tirare a indovinare.
  • Rendilo facile da trovare e facile da usare. Porta il self-service nel punto in cui la domanda emerge davvero, sulla pagina, nella chat, prima della chiamata, e lascia che le persone chiedano con parole proprie invece di cercare tra i menu.
  • Misura la risoluzione, non solo la deflection. Monitora i contatti ripetuti e le escalation dopo la deflection. Se crescono insieme al tasso di deflection, stai rimandando, non deflettendo. Correggi i punti deboli che i dati mettono in evidenza.
  • Instrada bene tutto il resto. Alcuni contatti devono arrivare a una persona. Fai in modo che questo passaggio sia rapido e ricco di contesto, così anche i casi che non defletti restano un’esperienza positiva.

Cosa stiamo costruendo in Invent

In Invent costruiamo assistenti AI che deflettono risolvendo, non bloccando.

  • Ancorati ai tuoi dati. Le risposte arrivano dalla tua knowledge base e da azioni in tempo reale, così l’assistente risolve il problema invece di limitarsi a indicare una pagina.
  • Nelle parole e nella lingua del cliente. Niente menu da navigare, niente fallback solo in inglese: il cliente chiede in modo naturale e ottiene una risposta vera.
  • Su ogni canale, in un unico posto. Chat, web, WhatsApp e altro ancora, così la deflection avviene ovunque il cliente si trovi già.
  • Passaggio pulito quando serve. Quando una domanda richiede davvero una persona, l’assistente la passa con tutto il contesto, così non si perde nulla e nessuno deve ripetersi.

L’obiettivo non è mai tenere i clienti lontani dal telefono. È rendere il telefono superfluo, e fare in modo che ne siano contenti.

In conclusione

La call deflection è un buon concetto quando significa "abbiamo risolto il problema prima che dovessi aspettare" ed è un cattivo concetto quando significa "ti abbiamo tenuto fuori dalla coda". La differenza sta nel fatto che il problema del cliente sia stato davvero risolto. Misura il tasso di deflection, ma osserva accanto anche la risoluzione e i contatti ripetuti, e costruisci un self-service che risponda davvero invece di deflettere fine a sé stesso.

La deflection non consiste nel togliere di mezzo la chiamata. Consiste nel renderla superflua.

FAQ

Che cos’è la call deflection?

La call deflection consiste nel risolvere le richieste dei clienti tramite self-service o canali automatizzati, come una knowledge base, un chatbot, un assistente AI o un IVR, così da gestirle senza un operatore umano. Un contatto si considera deflesso solo se il cliente ha davvero ottenuto la sua risposta e non ha avuto bisogno di passare a una persona.

Che cos’è il tasso di deflection e come si calcola?

Il tasso di deflection è la percentuale di richieste risolte senza un operatore umano. La formula più semplice è (risoluzioni via self-service / richieste totali) × 100. Per esempio, 200 risoluzioni via self-service su 1.000 richieste equivalgono a un tasso di deflection del 20%. Per essere accurati, conta solo le richieste per cui il cliente non ha poi avuto un contatto live di follow-up.

Qual è un buon tasso di call deflection?

Molti team puntano al 40% o più, e un self-service ben ancorato ai dati può andare considerevolmente oltre. Ma il tasso conta solo se quei clienti hanno davvero ottenuto una soluzione. Un tasso di deflection alto costruito su un bot frustrante è peggiore di un tasso più basso che aiuta davvero, quindi monitora insieme anche risoluzione e contatti ripetuti.

Qual è la differenza tra call deflection e ticket deflection?

È la stessa idea applicata a canali diversi. La call deflection si riferisce alle chiamate telefoniche; la ticket deflection alle email o ai ticket dell’help desk; la chat deflection alla live chat. In tutti i casi, un contatto è deflesso quando il cliente risolve il problema tramite self-service invece che con un operatore umano.

La call deflection danneggia la customer experience?

Solo quando viene fatta male. Una deflection che scarica i clienti in menu senza uscita o su bot che non riescono a capirli aumenta frustrazione e churn. Una deflection che fornisce una risposta rapida e corretta tramite self-service aumenta la soddisfazione, perché la maggior parte delle persone preferisce risolvere un problema semplice in pochi secondi piuttosto che aspettare in coda.

In che modo l’AI migliora la call deflection?

Un assistente AI ben ancorato ai dati capisce la domanda del cliente nelle sue parole e risponde usando i tuoi dati reali, la tua knowledge base per le domande flessibili e azioni in tempo reale per quelle precise come stato dell’ordine o fatturazione. Questo gli consente di risolvere una gamma di problemi molto più ampia rispetto a una FAQ statica o a un bot ad albero decisionale, e di passare in modo pulito a un operatore umano quando un contatto ne ha davvero bisogno.

Correlati

La deflection si guadagna una cattiva fama solo quando evita il problema. Costruisci un self-service che risolve, e "deflection" diventa il momento in cui un cliente ha ricevuto aiuto prima ancora di dover aspettare.

Comece a criar seu Assistente grátis

Sem necessidade de cartão de crédito.

Continuar lendo

Ogni cliente che smette di rispondere è una vendita persa. Ecco come abbiamo risolto il problema.
Product

Ogni cliente che smette di rispondere è una vendita persa. Ecco come abbiamo risolto il problema.

La maggior parte delle conversazioni interrotte non riprende più. Gli Auto Follow-ups di Invent cambiano le cose, trasformando i contatti che spariscono in trattative chiuse, automaticamente.

Arshad Yaseen
Arshad Yaseen
May 26, 26
Messaggi di benvenuto per la live chat: oltre 30 esempi (più l’upgrade con l’AI)
Industry

Messaggi di benvenuto per la live chat: oltre 30 esempi (più l’upgrade con l’AI)

Esempi e modelli di messaggi di benvenuto per la live chat, suddivisi per settore e scenario, con le regole giuste per il timing e il modo in cui un assistente AI personalizza il saluto in qualsiasi lingua.

Alix Gallardo
Alix Gallardo
May 26, 26
Quante lingue supporta ChatGPT? La risposta onesta
Industry

Quante lingue supporta ChatGPT? La risposta onesta

Quante lingue supporta ChatGPT? Ecco la risposta onesta, come si confronta con Gemini, Claude e Grok e perché il numero di lingue conta meno della qualità in ciascuna di esse.

Alix Gallardo
Alix Gallardo
May 25, 26
Assistenza clienti vs servizio clienti (e come l’AI sta cambiando entrambi)
Industry

Assistenza clienti vs servizio clienti (e come l’AI sta cambiando entrambi)

Assistenza clienti e servizio clienti: definizioni chiare, confronto diretto, metriche da monitorare, passaggio di consegne tra i team e il modo in cui l’AI sta trasformando entrambi.

Alix Gallardo
Alix Gallardo
May 25, 26
#020: Modalità Solo Umana e modelli Gemini 3.5 Flash
Changelog

#020: Modalità Solo Umana e modelli Gemini 3.5 Flash

Invent #020: la nuova modalità Solo Umana ti permette di disattivare le risposte dell’AI e mantenere il supporto VIP gestito da persone, insieme ai modelli Gemini 3.5 Flash per conversazioni AI più rapide e intelligenti.

Alix Gallardo
Alix Gallardo
May 22, 26
Come l’AI personalizza la customer experience: cosa funziona davvero e cosa è solo hype
Industry

Come l’AI personalizza la customer experience: cosa funziona davvero e cosa è solo hype

La personalizzazione con l’AI nella customer experience: dove funziona davvero oggi, cosa è ancora solo hype e quali decisioni su dati, governance e fiducia ogni imprenditore deve affrontare.

Alix Gallardo
Alix Gallardo
May 22, 26