Vaak hoort men dat het behouden van een klant 5 tot 10 keer minder kost dan één nieuwe te winnen. Neem daarbij het feit dat bij heel wat bedrijven 20% van de klanten zorgen voor 80% van de omzet, dan begrijpt u meteen hoe belangrijk het is om de loyaliteit van uw klanten op te volgen en te detecteren welke klanten het risico lopen uw bedrijf te verlaten. Zo kan u acties in lijn met de karakteristieken en gedragingen van deze klanten opzetten, waardoor u deze klanten behoudt, voor het te laat is!
Een specifieke definitie geven van wat nu precies een trouwe klant is blijkt een complexe zaak. Het begrip varieert in functie van de sector. In de detailhandel zal een trouwe klant één of meerdere keren per week een keten bezoeken, terwijl in de automotive sector de contacten zich beperken tot het onderhoud van een wagen, de herstelling ervan en de aankoop van een andere wagen. Bepaalde managers typeren een trouwe klant als individuen die eenmaal per jaar iets in hun bedrijf of webshop kopen. Anderen nemen voornamelijk het bestede bedrag in acht. Bij banken, verzekeringen en mutualiteiten weet men dat het aantal interacties zeer beperkt is. Klantentrouw wordt er voornamelijk gekenmerkt door het aantal transacties, het uitblijven van klachten en het feit dat een contract niet werd opgezegd.
Een nauwkeurige definitie van klantentrouw bepalen is uiterst belangrijk om dit gedrag bij uw klanten te kunnen analyseren en voorspellen. De exacte definitie, die past bij uw klanten en bedrijf, wordt teruggevonden in de klantendata. Hoe dit mogelijk is? Door uw gegevens te analyseren onderscheidt u specifieke patronen over de winkelbezoeken en aankopen van uw klanten. Deze karakteristieken zijn vaak heterogeen binnen een klantenbestand. Zo kan u bijvoorbeeld denken aan zeer stipte klanten voor hun aankopen of bezoeken, klanten die steeds te laat komen of die opeens een contactmoment overslaan. Het is daarom noodzakelijk om een individuele score te geven aan iedere klant, specifiek voor het bestudeerde aankooppatroon. Zo heeft u een nauwere opvolging en detecteert u tijdig welke klanten een hoog risico lopen het bedrijf te verlaten.
Zodra de definities van trouwe en ontrouwe klanten duidelijk afgebakend zijn, kunnen we op basis van historische transactiedata twee duidelijk afgelijnde groepen maken (de trouwe en de ontrouwe klanten). De analyse van de aankoopkarakteristieken en de sociodemografische profielen van iedere groep zorgen ervoor dat we de parameters onderscheiden die “triggers” zijn van de ontrouw. Deze parameters kunnen zeer divers zijn en hangen ook af van de sector waarin men zich bevindt. Een paar voorbeelden: een prijzige factuur, een verouderd product, de leeftijd van de klant, zijn inkomen, de verhuis of sluiting van een verkooppunt, een klacht die niet werd afgehandeld, de campagne van een concurrent, … Vaak is het zelfs een combinatie van verschillende parameters die het plotseling verdwijnen van een klant verklaren.
Door deze parameters te integreren in een voorspellend analytisch model is het mogelijk een score te berekenen voor iedere klant van uw bedrijf. Deze score is een indicatie van het risico dat uw bedrijf loopt om een bepaalde klant te verliezen. Zodra deze score een bepaalde drempel bereikt is het raadzaam dat het bedrijf met gepaste commerciële of marketingacties tracht de loyaliteit van de klant te waarborgen.
Deze aanpak is bruikbaar in heel wat sectoren zoals bij banken, verzekeringen, detailhandel, automotive, … Webshops als Amazon, Zalando, Bom.com, … zijn ware koplopers in deze methodes. Hun businessmodel focust sterk op een geavanceerd gebruik van aankoop- en gedragsdata van hun klanten. Zij gebruiken al deze gegevens onder meer om toekomstige aankopen te voorspellen, maar ook om het ideale moment te bepalen voor een “op maat” promotie aan te bieden.
Om een model te ontwikkelen dat dit risico op ontrouw kan voorspellen is het van cruciaal belang om heel wat data te verzamelen. Denk bijvoorbeeld aan de volgende data:
Hou ook rekening met ‘niet-gebeurtenissen’. Het ontbreken van een bezoek of aankoop is ook een belangrijke indicator in de klantrelatie.
Wanneer de relatie tussen de klant en het bedrijf wordt beëindigd, merken we dat tal van factoren daarin een rol spelen. Zo is zijn vertrek misschien het gevolg van een negatieve ervaring, een prijzige factuur, een verhuis, een gebrek aan financiële middelen, … Bepaalde consumententypes blijken ook minder trouw aan merken en bedrijven dan andere consumententypes. Heel wat van bovenstaande verklaringen kan men kwantificeren. Wat kwantificeerbaar is, kan gebruikt worden om voorspellingen te maken. De voorspelling waar we over spreken is de berekening van een waarschijnlijkheid: hoe groot is de waarschijnlijkheid dat de klant zijn relatie met het bedrijf op korte termijn verbreekt. Aangezien iedere gebeurtenis (of niet-gebeurtenis!) de score van de klant beïnvloedt, wordt deze loyaliteit van klanten best op regelmatige basis geëvalueerd.
Ongeacht het model dat we ontwikkelen om het klantengedrag te voorspellen, vinden we steeds een gelijkaardige aanpak terug. Eerst filteren we uit een klantenbestand met voldoende historische data twee datasets. De eerste dataset dient om het model te trainen, de tweede dataset is voor de validatie van het model. In beide datasets moeten we over voldoende historische gegevens beschikken. Zo kunnen we nagaan of een klant op één welbepaalde datum nog steeds ‘trouw’ was. Beide datasets worden vervolgens verrijkt met externe data (onder meer sociodemografische gegevens) om aan iedere klant een zo goed mogelijk beeld te krijgen.
Op basis van de eerste dataset, die dient om het model te trainen, wordt het model ontwikkeld (zo leert het model wat een trouwe of ontrouwe klant is). Met het gepaste analytisch model, onderscheiden we in de massa gegevens de pertinente factoren evenals hoe deze gecombineerd worden om het gedrag te verklaren. Door te leren welke factoren interessant zijn en hoe deze op elkaar inspelen is het model in staat om, op zo betrouwbaar mogelijke wijze, het gedrag van de klant te voorspellen. Bij het gebruik van de tweede dataset toetsen we de kwaliteit van de voorspelling met klanten die niet werden gebruikt in de trainingsfase.
Een goed getraind en gevalideerd model kan zeer nauwkeurig een score berekenen die het risico op ontrouw van de klant voorspelt.
Tal van modellen kunnen ontwikkeld worden om de potentiele churners binnen een klantengroep te onderscheiden. Bij SIRIUS Insight testen we steeds meerdere modellen en werkwijzen om zo een robuust en betrouwbaar model te leveren dat past bij uw bedrijf.
Het arsenaal aan mogelijke modellen is zeer breed. Deze omvatten zowel simpele classificatiemodellen, zoals regressies en decision trees, als complexe machine learning modellen zoals neural networks, random forests, support vector machine,…
Regressiebenaderingen zijn eenvoudig te implementeren en gemakkelijk interpreteerbaar (men kan de redenering van het model “volgen”), wat over het algemeen een geruststellende factor is. Helaas zijn deze modellen niet flexibel en zijn hun resultaten vaak teleurstellend, vooral wanneer bij de voorspelling meerdere factoren een rol spelen.
De machine learning oplossingen bieden een indrukwekkende flexibiliteit en passen zich goed aan diverse en complexe problematieken aan. Voornamelijk bij de zoektocht naar specifieke patronen in een grote hoeveelheid data (zoals bij het verklaren van de churn van klanten) bereiken deze methodes betere resultaten dan klassiekere modellen. De keerzijde van deze oplossingen is dat het moeilijk tot onmogelijk is om de redenering van de algoritmes te volgen. Bij een gebrek aan validatie bestaat ook het risico dat het model een vorm van “overfitting” kent.
Het gebeurt vaak dat een model interessante resultaten verkrijgt op de eerste dataset, waarop het model werd getraind. Zodra echter aan ditzelfde model een andere dataset gegeven wordt, lopen de voorspellingen mis wat resulteert in relatief willekeurige resultaten. In dit geval spreekt men van de overfitting van het model. Dit is een fenomeen dat voorkomt wanneer het model te nauwkeurig is afgestemt op de trainingsdataset.
Het beste model dat men kan kiezen is het model dat zorgt voor de meest robuuste resultaten bij de validatieronde. Het simpelste model blijkt ook vaak het beste model te zijn. Daarom raden we aan om bij churn voorspellingen steeds te starten met een grondige analyse van de beschikbare gegevens, vervolgens met klassieke modellen te werken en daarna pas over te gaan naar technieken als machine learning.