Fidéliser un client coûte 5 à 10 fois moins cher que d’en gagner 1 nouveau. Ajoutez à cela que dans la plupart des entreprises, 20% des clients génèrent 80% des bénéfices, vous comprendrez aisément l’importance de fidéliser les clients et de détecter ceux qui risquent de quitter l’entreprise. Préparez ainsi des actions adaptées à leurs caractéristiques et comportements afin de les récupérer avant qu’il ne soit trop tard !
Il semble compliqué de donner une définition précise de la fidélité d’un client. Cette notion varie fortement en fonction des secteurs. Dans la grande distribution, le client fidèle fréquente une ou plusieurs fois par semaine une enseigne, alors que dans le secteur automobile, les contacts se limitent aux entretiens, réparations et nouveaux achats. Certains dirigeants estiment donc qu’un client fidèle est celui qui achète une fois par an dans son entreprise ou webshop, d’autres vont prendre en considération le montant dépensé. Dans d’autres secteurs comme le secteur bancaire, les assurances et les mutuelles, le nombre d’interactions peut être très faible. La fidélité sera alors définie par le nombre de transactions, l’absence de plaintes et l’absence de renom.
Pourtant, définir précisément cette notion est essentiel lorsque vous souhaitez analyser et prédire le comportement de vos clients. La définition exacte, propre à votre entreprise, se trouve dans vos données clients ! En effet, en analysant ces données, il est possible de détecter des patterns d’achat et de visite des clients de votre entreprise. Les caractéristiques sont souvent hétérogènes au sein d’un groupe de clients ; certains anticipent l’achat ou la visite, d’autres sont en retard ou sautent juste un passage ou un achat. Du coup, il s’avère intéressant d’attribuer une notion individuelle, spécifique à chaque client. Ceci permettra de détecter plus vite un accroissement du risque de perdre définitivement un client.
Dès que les définitions sont bien établies, il est possible de créer deux groupes distincts (fidèles et infidèles) à partir des historiques d’interactions (achats ou autres). En analysant les caractéristiques d’achat et les profils socio-démographiques de chaque groupe, nous détectons les déclencheurs de l’infidélité. Ils peuvent être très variables et fortement dépendant du secteur d’activité : une facture très élevée, un produit qui vieillit, l’âge du client, ses revenus, un déménagement ou la fermeture du point de vente, une plainte non résolue, une campagne concurrente … ou une combinaison de ceux-ci expliquent la disparition soudaine du client.
En intégrant ces facteurs dans un modèle prédictif, il est possible de calculer un score pour chaque client de l’entreprise. Le score représente la probabilité de perdre le client. Lorsque cette probabilité atteint un certain seuil, il est judicieux d’entreprendre des actions commerciales et de marketing afin de fidéliser le client avant même qu’il ait quitté l’entreprise.
Cette approche s’applique à de nombreux secteurs d’activités tels que la banque, les assurances, la grande distribution, l’automobile, … Les avant-gardistes de ces méthodes sont indéniablement les webshops tels Amazon, Zalando, Bol.com, … Leur business model est fortement basé sur une utilisation avancée des données d’achat et de comportement de leurs clients. Ils se servent par exemple de celles-ci pour prédire les achats futurs, mais aussi afin de déterminer le moment idéal pour relancer le client avec une promotion sur mesure.
Pour réaliser un système capable de prédire le risque d’infidélité du client, il est indispensable de réunir un nombre important de données. Pensez notamment aux données suivantes :
Soyez également attentifs aux « non-événements », l’absence d’une visite ou d’un achat est également un indicateur important dans la relation avec le client.
De nombreux facteurs interviennent lorsqu’un client décide de rompre sa relation avec l’entreprise. Son départ est peut-être dû à une mauvaise expérience, une facture élevée, un déménagement, un manque de moyens financiers, … En plus de cela, certains types de consommateurs semblent plus volatils que d’autres. La plupart des ces raisons peuvent être quantifiées, et ce qui est quantifiable peut être utilisé pour réaliser une prédiction. Cette prédiction s’exprimera sous forme d’une probabilité : la probabilité que le client rompe sa relation dans un avenir proche. Idéalement, la fidélité du client doit être estimée régulièrement car tout évènement (ou non-évènement !) est susceptible de modifier le score de fidélité du client. Il ne s’agit pas d’une probabilité figée !
Quel que soit le système ou modèle que l’on mettra en œuvre pour prédire le comportement de fidélité du client, l’approche sera toujours la même : on va extraire du fichier clients deux échantillons : apprentissage et validation. Pour chaque individu, qui peuple les échantillons on peut déterminer à une date donnée s’ils sont fidèles ou non. On enrichit ces deux jeux de données avec des données externes permettant d’associer à chaque client le plus d’informations possible (notamment socio démographiques).
On se sert de l’échantillon d’apprentissage pour construire le modèle (pour lui apprendre ce qu’est un client fidèle et infidèle). Si le modèle choisi est adéquat, il détectera dans la masse de données dont il dispose les éléments utiles et la manière de les combiner pour arriver à prédire de manière la plus juste possible le comportement observé du client. On utilisera ensuite l’échantillon de validation pour tester la qualité de la prédiction sur des clients qui n’ont pas été utilisés dans la phase d’apprentissage.
Un modèle bien entrainé et validé sur des échantillons tests (dont on connait le comportement « final » du client) permettra d’estimer correctement la probabilité qu’un client reste fidèle ou non.
De nombreux modèles peuvent être déployés pour traquer les churners potentiels parmi ses clients. Chez SIRIUS Insight, nous testons plusieurs approches et modèles afin de livrer à nos clients un « système » robuste et fiable, le mieux adapté à son business.
Le « recueil de modèles » à notre disposition est très large, il commence avec des modèles de classification simple dont les régressions par arbres et logistiques font partie, jusqu’à des techniques élaborées de machine learning ou d’intelligence artificielle telles que des réseaux de neurones, random forest, support vector machine, …
Les approches par régression sont simples à mettre en œuvre et facilement interprétables (on peut « suivre » le raisonnement du modèle), ce qui est en général un facteur « rassurant ». Cependant, ces approches sont rigides et seront plutôt décevantes dans des situations ou la combinaison de facteurs est particulièrement déterminante dans le processus de churning.
Les solutions de type « machine learning » offrent une plasticité étonnante (adaptation au problème) et surclassent beaucoup de méthodes traditionnelles quand il s’agit d’identifier parmi une masse importante de données les « patterns » caractéristiques qui font qu’un client devient un « churner ». En revanche, il est beaucoup plus difficile, voire impossible, de suivre le « raisonnement » de l’algorithme. D’autre part l’« overfitting » guette l’analyste imprudent qui ne se plie pas à l’impitoyable discipline de la validation.
En effet, il arrive souvent qu’un modèle produise des résultats prometteurs sur l’échantillon d’apprentissage, mais que lorsqu’on lui présente un échantillon de validation, le modèle dérape et produise des résultats plutôt aléatoires. Dans ce cas, nous parlons de « overfitting » du modèle, c’est un phénomène qui s’observe lorsque le modèle s’ajuste trop sur le jeu de données d’apprentissage qui lui a été confié.
Le meilleur modèle est celui qui produit les résultats les plus robustes sur les échantillons de validation et est aussi le modèle le plus simple ! Il est toujours conseillé dans l’analyse du churn, après une analyse approfondie des données disponibles, de partir des méthodes les plus classiques avant de soumettre à tout va, vos données aux techniques de machine learning.