IA en service client : pourquoi le ROI plafonne après les premiers mois

Selon Gartner, 30 % des projets d'IA générative sont abandonnés après le proof of concept, et 40 % des projets d'IA agentique seront annulés d'ici 2027. Ces chiffres ne décrivent pas une technologie qui ne fonctionne pas. Ils décrivent des organisations qui n'avaient pas les conditions pour faire fonctionner ce qu'elles avaient déployé. La nuance est essentielle, parce qu'elle change complètement les actions à mener.

Partager sur
Sommaire :

Le pilote s’est bien passé. Le taux de déflexion a grimpé. Le prestataire technologique a félicité les équipes. Puis, quelques mois après la mise en production, les gains se sont stabilisés. Le CSAT n’a pas progressé comme prévu. Les économies opérationnelles sont là, mais plus modestes que dans la présentation initiale. Et personne dans l’équipe ne sait vraiment expliquer pourquoi.

Ce scénario est plus fréquent qu’on ne le dit dans les conférences. Selon Gartner, au moins 30 % des projets d’IA générative sont abandonnés après le proof of concept, et plus de 40 % des projets d’IA agentique seront annulés d’ici 2027 pour les mêmes raisons : coûts sous-estimés, valeur métier floue, absence de gouvernance. Ce n’est pas une technologie défaillante. Ce sont des déploiements qui ont manqué de conditions.

Cinq causes reviennent systématiquement quand on examine de près les projets IA en service client qui plafonnent. Elles ne sont pas indépendantes les unes des autres, et c’est souvent leur combinaison qui produit le sentiment d’impasse.

Les 5 causes du plafonnement du ROI IA en service client

Les 5 causes du plafonnement du ROI IA en service client Frise verticale des 5 causes identifiées du plafonnement du ROI IA en service client : mauvaises métriques, base de connaissance dégradée, conseillers non préparés, périmètre figé, absence de gouvernance. 1 On mesure la déflexion, pas la valeur Le KPI du COMEX ne capture pas ce que le client a réellement vécu 2 La base de connaissance n'a pas suivi L'IA est aussi précise que ce qu'on lui donne à manger 3 L'humain a hérité des cas impossibles Le flux humain est plus complexe, la formation n'a pas suivi 4 Le périmètre du bot n'a jamais été réévalué Ni élargi là où ça marche, ni réduit là où ça dégrade 5 Personne ne pilote l'IA comme on pilote une équipe Pas de gouvernance active, le bot se dégrade sans signal d'alarme Sources : Gartner 2024-2025 · MIT CISR 2025 · Zendesk CX Trends 2024 · Armatis CX Horizon 2030
Sommaire :

Cause 1 : on a mesuré la déflexion, pas la valeur

L’IA a été déployée pour réduire le volume d’interactions humaines, et c’est ce qu’elle a fait. Le taux de déflexion monte, les équipes RH respirent, la direction est satisfaite. Mais la déflexion n’est pas un indicateur de satisfaction : c’est un indicateur de volume. Un client « défléchi » qui n’a pas obtenu sa réponse n’est pas un contact évité, c’est un client frustré qui rappellera, enverra un email, ou abandonnera silencieusement.

Le problème est que le KPI qui a justifié le projet au COMEX (taux de déflexion) ne mesure pas ce que le client a réellement vécu. Et dans beaucoup d’organisations, personne ne mesure le CSAT spécifique aux interactions bot, séparément du CSAT global. Résultat : le ROI opérationnel semble tenir, mais la valeur relationnelle s’érode sans qu’on le voit dans les tableaux de bord. Comme le formule David Gillaux, Président d’Armatis : « La question n’est pas ‘est-ce que ça coûte moins cher ?’ mais ‘est-ce que le ROI est bon ?' » La distinction n’est pas sémantique : elle détermine si on pilote la bonne chose.

La correction est connue : mesurer le CSAT bot et le CSAT humain séparément, croiser avec le taux de réitération (les clients qui recontactent dans les 48 heures après une interaction bot), et intégrer le taux de résolution en autonomie comme KPI principal plutôt que la déflexion seule. Un chatbot performant résout entre 60 et 80 % des cas qu’il prend en charge. En dessous de 60 %, le périmètre est trop large ou les scénarios sont mal calibrés.

Déflexion vs valeur réelle — les deux métriques à ne pas confondre

Déflexion vs résolution : deux métriques qui ne mesurent pas la même chose Comparaison entre le taux de déflexion (ce qu'on mesure) et le taux de résolution en autonomie (ce qu'on devrait mesurer) pour évaluer le ROI réel d'un déploiement IA en service client. Taux de déflexion Ce que le COMEX suit Mesure le volume évité Ne dit pas si le client a obtenu sa réponse Taux de résolution en autonomie Ce qu'il faudrait piloter Mesure la valeur réelle créée Cible : 60 à 80 % des cas pris en charge résolus En dessous de 60 % de résolution en autonomie : le périmètre est trop large ou les scénarios sont mal calibrés.

Cause 2 : la base de connaissance n’a pas suivi

Au moment du déploiement, la base de connaissance était à jour. Les produits correspondaient aux fiches. Les processus étaient correctement documentés. L’IA répondait bien. Puis le temps a passé : une offre a changé, un processus a été modifié, un tarif a évolué. La base de connaissance, elle, est restée celle du jour du go-live.

C’est l’angle mort le plus sous-estimé dans les projets IA service client. L’IA est aussi précise que ce qu’on lui donne à manger. Quand la connaissance se dégrade, l’IA commence à donner des réponses obsolètes ou contradictoires. Le client perd confiance, le taux de transfert vers l’humain monte, le CSAT bot chute. Et le problème est difficile à diagnostiquer parce que les symptômes ressemblent à un problème technologique alors qu’il s’agit d’un problème éditorial.

L’étude CX Horizon 2030 d’Armatis, menée auprès de directeurs CX de grandes marques françaises (ENGIE, Volkswagen, SFR, LVMH, MACIF, Matmut, La Banque Postale, Carrefour), le formule directement : la base de connaissance n’est plus un référentiel statique, c’est le moteur de la performance IA. Une IA agentique ne compense pas une connaissance floue, contradictoire ou non tenue à jour. Notre article sur l’intelligence contextuelle et le passage de l’automatisation à la vraie personnalisation détaille comment cette connectivité de la connaissance change la donne opérationnelle.

Cause 3 : l’humain a hérité des cas impossibles sans y être préparé

En retirant les cas simples du flux humain, on ne l’a pas allégé : on l’a durci. Les conseillers traitent maintenant un flux concentré de situations complexes, émotionnelles, difficiles à résoudre, souvent après que le client a déjà été frustré par une interaction bot qui n’a pas abouti. C’est précisément là où la qualité relationnelle et la capacité à résoudre comptent le plus.

Or, dans beaucoup de centres de contact, la formation des conseillers n’a pas évolué en parallèle du déploiement IA. Selon les données Zendesk CX Trends 2024, plus d’un agent sur deux n’a reçu aucune formation aux nouveaux outils et technologies, et parmi ceux formés, seulement 21 % jugent cette formation satisfaisante. Un conseiller qui reçoit uniquement les cas complexes sans avoir été formé à les gérer, avec des outils qui ne lui donnent pas le contexte de ce qui s’est passé avant lui dans l’interaction, produit un CSAT dégradé précisément sur les interactions les plus visibles.

L’effet combiné est pervers : l’IA améliore l’efficacité sur les cas simples, mais dégrade la qualité perçue sur les cas complexes, qui sont justement ceux que les clients mémorisent. Le bilan net peut être négatif sur la fidélisation même quand il est positif sur les coûts. C’est pourquoi l’amélioration du CSAT en centre de contact ne peut pas se faire sans traiter simultanément la montée en compétences des conseillers sur les cas complexes.

Cause 4 : le périmètre du bot n’a jamais été réévalué

Au démarrage, le périmètre a été défini de façon conservatrice : quelques typologies de demandes simples, bien documentées, avec des données accessibles. C’était raisonnable. Puis personne n’a réévalué ce périmètre. Ni pour l’élargir quand les premiers succès ont été confirmés, ni pour le réduire quand certains cas se sont avérés trop complexes pour le bot.

Le résultat est un périmètre figé qui ne correspond plus ni aux ambitions initiales ni à la réalité opérationnelle. Les cas qui créent de la valeur ne sont pas automatisés. Les cas qui créent de la friction le sont encore. Et la direction constate que le ROI ne progresse plus, sans comprendre que le problème est l’absence de gouvernance active du périmètre, pas la technologie elle-même.

Selon le MIT CISR, 95 % des projets pilotes d’IA générative n’ont pas d’impact mesurable sur le P&L. La distinction entre les 5 % qui y parviennent et les 95 % qui stagnent tient en grande partie à cette gouvernance continue : des revues régulières du périmètre, des décisions documentées sur les cas à élargir ou à retirer, et des métriques d’impact qui dépassent le taux de déflexion.

Cause 5 : personne ne pilote l’IA comme on pilote une équipe

Quand un nouveau conseiller arrive dans un centre de contact, il est accompagné, coaché, évalué, formé en continu. Son score CSAT est suivi. Ses erreurs sont analysées. Un plan de développement est construit. Quand un bot est déployé, il produit ses interactions dans une relative boîte noire, sans que personne examine systématiquement les conversations mal traitées, sans enrichissement continu des scénarios, sans responsable clairement identifié pour décider des évolutions.

Ce défaut de gouvernance est le dénominateur commun de tous les projets qui plafonnent. Le projet a été livré, l’éditeur est passé à autre chose, et les équipes internes n’ont pas la bande passante ou les compétences pour maintenir le système en conditions opérationnelles optimales. Le bot se dégrade progressivement sans signal d’alarme visible, jusqu’à ce que le CSAT commence à baisser et que personne ne fasse le lien.

La solution n’est pas technique : c’est organisationnelle. Elle passe par la désignation d’un responsable de la performance bot avec un mandat clair, des revues hebdomadaires des conversations mal traitées (exactement comme des écoutes qualité sur les conseillers humains), et un processus d’enrichissement continu de la base de connaissance et des scénarios. Les 15 KPI essentiels pour piloter un centre de contact s’appliquent aussi aux dispositifs IA : CSAT, FCR, taux de réitération, quality score.

Sans gouvernance active, le déploiement IA se dégrade en silence

Sans gouvernance active, le déploiement IA se dégrade en silence Cycle de dégradation d'un déploiement IA sans gouvernance : base de connaissance obsolète, réponses erronées, hausse des transferts, CSAT bot dégradé, churn silencieux. Déploiement réussi Pilote validé, go-live Produits évoluent Base non mise à jour Réponses obsolètes Transferts vers humain CSAT bot dégradé Churn silencieux ROI stagne Direction cherche pourquoi La gouvernance active brise ce cycle à chaque étape Sources : Gartner · MIT CISR · Armatis CX Horizon 2030 · Zendesk CX Trends 2024

Ce que les décideurs CX disent vraiment de l’IA en 2026

L’étude CX Horizon 2030 d’Armatis, menée auprès de directeurs CX de grandes marques françaises, apporte un éclairage précieux parce qu’elle sort du discours des éditeurs pour recueillir celui des praticiens. Aucun des décideurs interrogés n’envisage un service client 100 % automatisé à horizon 2030. Tous positionnent l’IA comme un levier d’augmentation du conseiller, pas de remplacement. Et deux citations résument l’état d’esprit du terrain mieux que n’importe quelle projection de marché.

Thierry Suquet, Directeur Expérience Client chez Volkswagen France : « L’IA n’a pas le droit à l’erreur. Un agent humain peut s’excuser et récupérer une situation. Un bot qui se trompe détruit la confiance. » Dominique Russo, Directeur Expérience Client à la MACIF : « La sincérité de la relation est incompatible avec un bot qui prétend être humain. »

Ces positions ne sont pas hostiles à l’IA. Elles décrivent simplement les conditions dans lesquelles l’IA crée de la valeur durable : sur les cas simples et bien définis, avec des données fiables, dans une architecture hybride où l’humain reste visible et accessible. Et avec, selon l’étude, 85 % des décideurs qui considèrent désormais le service client comme un centre de profit et non un centre de coûts, la vraie question n’est plus « comment réduire les dépenses avec l’IA » mais « comment l’IA aide à générer plus de valeur dans chaque interaction ».

Comment relancer un ROI qui stagne

Les cinq causes identifiées appellent cinq actions concrètes, dans un ordre qui a de l’importance.

La première est de refaire l’audit des métriques. Remplacer le taux de déflexion comme KPI principal par le taux de résolution en autonomie, et ajouter le CSAT bot, le taux de réitération post-bot et le taux de transfert. Ces quatre indicateurs donnent une image honnête de ce que l’IA produit réellement.

La deuxième est d’auditer la base de connaissance. Identifier les fiches obsolètes, les processus non documentés, les produits dont la description n’a pas été mise à jour. C’est souvent ce travail éditorial qui débloque le plus de valeur IA à court terme.

La troisième est de former les conseillers aux nouveaux cas qui arrivent chez eux. Ce ne sont plus les mêmes interactions qu’avant le déploiement bot. Elles sont plus complexes, plus émotionnelles, plus exigeantes. La formation doit suivre.

La quatrième est de réévaluer le périmètre du bot avec une grille simple : sur quels cas le taux de résolution en autonomie dépasse 70 % ? Ce sont les cas à conserver. Sur quels cas il est inférieur à 50 % ? Ce sont les cas à retirer du périmètre ou à retravailler avant de les y maintenir.

La cinquième est d’installer une gouvernance formelle : un responsable identifié, des revues régulières, un processus d’enrichissement continu. L’IA n’est pas un produit qu’on installe. C’est un système vivant qui se dégrade sans maintenance active.

Pour aller plus loin sur le pilotage de la performance en centre de contact avec ou sans IA, découvrez notre guide sur les KPI et SLA d’un centre de contact externalisé et la plateforme SquAire Interaction, conçue pour combiner performance humaine et automatisation intelligente dans une architecture data-driven.

FAQ : ROI de l’IA en service client

Pourquoi le ROI de l’IA en service client est-il difficile à mesurer ?

Parce que les métriques utilisées pour justifier le projet (taux de déflexion, coût par interaction) ne capturent pas tous les effets du déploiement. Un client défléchi qui n’a pas obtenu sa réponse génère des coûts invisibles : rappel, email, ou churn silencieux. Un ROI robuste intègre à la fois l’efficacité opérationnelle et la valeur relationnelle, mesurée par le CSAT bot, le taux de réitération et le FCR.

Combien de temps faut-il pour voir un ROI réel sur un déploiement IA en service client ?

Les gains de déflexion sont visibles dès les premières semaines. Les gains durables, qui intègrent la satisfaction client et la fidélisation, se consolident généralement entre 6 et 12 mois, à condition que la gouvernance soit active dès le démarrage. Les projets qui ne mettent pas en place cette gouvernance dès le premier mois sont ceux qui plafonnent après 6 mois.

L’IA est-elle adaptée à tous les types d’interactions en service client ?

Non, et c’est l’un des enseignements les plus constants des déploiements réels. L’IA crée de la valeur sur les cas simples, répétitifs, bien documentés et à faible charge émotionnelle. Sur les cas complexes, émotionnels ou à fort enjeu commercial, l’humain reste irremplaçable. Comme le note l’étude CX Horizon 2030 d’Armatis, aucun des directeurs CX interrogés n’envisage un service 100 % automatisé à horizon 2030.

Comment éviter que la base de connaissance devienne un frein au ROI IA ?

En traitant la base de connaissance comme un actif vivant, pas comme un livrable de projet. Cela suppose un propriétaire identifié, un processus de mise à jour systématique à chaque changement produit ou processus, et des audits réguliers de cohérence. Les organisations qui ont investi dans cette discipline éditoriale avant de déployer l’IA obtiennent des résultats significativement meilleurs que celles qui l’ont fait après.

Quelle est la différence entre un pilote IA réussi et un déploiement IA réussi ?

Le pilote réussit presque toujours : il est mené sur des cas favorables, avec des données propres, des équipes mobilisées et un suivi serré. Le déploiement doit tenir dans des conditions ordinaires : données imparfaites, équipes sous pression, périmètre plus large. C’est ce passage à l’échelle qui révèle les vraies conditions de succès. Selon Gartner, 30 % des projets d’IA générative sont abandonnés après le POC précisément parce que ces conditions n’ont pas été anticipées.

Sources

Partager sur

Armatis est un leader de l’expérience client (CX) qui transforme la relation marque-consommateur en un levier de performance durable. Expert du BPO, le groupe orchestre des modèles hybrides où l’innovation technologique et l’intelligence artificielle augmentent l’excellence humaine. Sous sa signature ‘Delivering Value’, Armatis accompagne la transformation des organisations avec une approche centrée sur la pertinence, l’empathie et l’impact business.

Besoin d'un partenaire d'externalisation ?

Contactez nos équipes pour échanger sur vos enjeux.

Black Friday, fêtes, soldes ou pics imprévus : Armatis vous aide à gérer les volumes critiques, adapter vos ressources et préserver la qualité client.

Rejoignez les leaders qui font confiance à notre expertise multilingue et technologique.