Le Data Mining : un cas client décrypté pas à pas
Expert de la connaissance client 
viadeo +33 (0)3 88 40 86 50

Le Data Mining : un cas client décrypté pas à pas

Data Mining - cas d'école

Les problématiques des entreprises qui font le choix du Data Mining sont nombreuses, variées et souvent complexes. Pour expliquer notre métier, nous avons donc décidé de décrypter, pas à pas, un exemple de démarche par lesquelles nous accompagnons nos clients.

Aujourd’hui nous vous présentons le cas de DMGM, la Droguerie de Ma Grand-Mère, entreprise de vente à distance spécialisée dans les produits de droguerie.

Pour des raisons de confidentialité et de clarté, l’exemple que nous vous proposons est un « cas d’école » au nom fictif et à la démarche simplifiée, mais construit à partir d’exemples bien réels.

Problématiques du client et du secteur

La Droguerie de Ma Grand-Mère (DMGM) est une entreprise de vente à distance (VAD), spécialisée dans la vente aux particuliers de produits de droguerie : produits d’entretien domestique, produits de soins corporels, produits santé/bien-être, produits pour animaux, produits de jardinage, etc.

La DMGM commercialise ses produits :

  • sur son site internet ;
  • en vente par correspondance (VPC) grâce à son catalogue mis à jour chaque année (environ 200 pages et plus de 9 000 références). Ce catalogue est envoyé chaque année aux clients de l’entreprise (environ 120 000 clients recensés dans la base CRM) mais il est également utilisé pour des campagnes de prospection commerciale par voie postale (près 400 000 envois par an).

Mais la DMGM est confrontée :

  • à un déclin régulier des performances de ses campagnes de prospection commerciale (taux de retour aujourd’hui à peine supérieur à 1%), dont le coût ne cesse par ailleurs d’augmenter.
  • à l’érosion de la fidélité de ses clients, à la stagnation du nombre d’achats par client et à celle du panier moyen.

Deux axes de travail ont donc été définis avec les experts en Data Mining :

  1. Augmenter la fréquence des achats et le montant du panier moyen pour les clients actuels.
  2. Améliorer l’efficacité des campagnes de prospection commerciale en améliorant les taux de retour et en réduisant leur coût.
Solution Data Mining #1 : Construction d’une segmentation fine du portefeuille clients

Data Mining Vente a distance

Etape 1 : Segmentation des clients par comportement d’achat

Pour augmenter la fréquence des achats et le montant du panier moyen, la démarche de Data Mining a été la suivante :

  1. Centralisation de l’ensemble des données disponibles sur les clients de DMGM : nom, prénom, adresse postale, historique des achats (catalogue et site internet), historique des réclamations, historique des sollicitations par canal, etc.
  2. Phase de dataquality pour « nettoyer » les données : dédoublonnage, normalisation des adresses postales, identification des foyers, suppression/correction des valeurs erronées ou aberrantes.
  3. Enrichissement par des données externes :
    – données géomarketing liée à l’adresse du client (taille de la commune, profil sociodémographique du quartier, etc.)
    – score prénom pour estimer l’âge du client
    – rapprochement de la base clients avec le fichier SIREN pour identifier d’éventuels clients « professionnels » et enrichissement par des données sur l’entreprise le cas échéant (secteur d’activités, CA, taille, catégorie juridique, etc.) notamment via l’entrepôt de données multi-canal du groupe CARTEGIE.
  4. Construction d’une segmentation des clients par comportement d’achat (méthode employée : analyse typologique multivariée).

4 macro-segments ont ainsi été dégagés lors d’une 1ère étape :

Data mining en 4 étapes

Les particuliers mono-catégorie concentrent leurs achats sur une seule catégorie de produits : entretien de la maison ou santé/bien-être. Ce sont essentiellement des acheteurs VPC (catalogue). Une niche particulière a été isolée : les clients à la recherche de produits de lutte et de prévention contre les insectes.

Les particuliers multi-catégories panachent leurs achats sur plusieurs catégories de produits (3 et plus). Ils sont intéressés aussi bien par les produits d’entretien que les produits de jardinage ou les soins corporels. Ils sont aussi bien acheteurs en ligne que VPC.

Les particuliers bio sont des acheteurs exclusifs de produits bio. Ils panachent leurs achats dans les catégories de produits entretien de la maison, santé/bien-être, soins corporels et jardinage. Ils sont aussi bien acheteurs en ligne que VPC.

Les entreprises : le rapprochement de la base clients avec le fichier SIREN et l’analyse détaillée des caractéristiques d’achats ont permis d’identifier un segment de clients qui sont en réalité des professionnels, issus majoritairement des secteurs des services : hôtellerie/restauration, petits commerces et services à la personne. Ce sont des entreprises de petite taille (<10 salariés), plutôt à la recherche de produits d’entretien bio/naturel en quantité importante. Ce sont des acheteurs essentiellement VPC (catalogue).

Etape 2 : Segmentation RFM (récence-fréquence-montant)

Dans une 2ème étape, une segmentation complémentaire de type RFM (récence-fréquence-montant) a été réalisée dans chacun des 4 macro-segments, afin de hiérarchiser les clients selon leur activité et leur valeur économique (CA). Ainsi, dans chaque segment, différents profils de clients ont été dégagés.

Segmentation RFM (récence-fréquence-montant)

Etape 3 : les actions mises en œuvre sur la base des résultats obtenus
  1. Le principe d’un catalogue général unique a été abandonné au profit de 5 catalogues thématiques beaucoup moins volumineux pour la prospection commerciale et un catalogue à destination des entreprises.
  2. Les actions marketing ont été repensées en fonction des segments visés et des profils clients à l’intérieur de chaque segment.

Segmentation RFM (récence-fréquence-montant)

Etape 4 : le bilan des actions mises en œuvre
  • CA total : +13%
  • Nombre de clients particuliers actifs : +9%
  • Nombre de clients entreprises actifs : +17%
  • Panier moyen : +10%
  • CA Produits Bio : +28%
  • CA Produits Entreprises : +19%
  • Réduction Coût Impression Catalogues : -32%
Solution Data Mining #2 : Construction d’un score de répondants aux campagnes de prospection commerciale

La DMGM réalise 2 campagnes de prospection commerciale par envoi de catalogue, pour un total de 300 000 catalogues envoyés chaque année. A cette fin, la DMGM loue des adresses de prospects particuliers auprès de brokers de fichiers sans ciblage précis ; plusieurs fichiers sont ainsi « essayés » chaque année. Mais les taux de réponse enregistrés sont en baisse régulière depuis plusieurs années pour se stabiliser aujourd’hui autour de 1%.

Il a donc été décidé de construire un modèle de score de prospection ayant pour objectif de déterminer la probabilité de réponse d’un prospect, en fonction de ses caractéristiques. Plus la note de score est élevée pour une adresse, plus grande est la probabilité qu’elle réponde favorablement à la sollicitation. Un modèle de score permet ainsi un meilleur ciblage des envois de catalogues.

Etape 1 : le Data Mining
  1. Récupération des données individuelles correspondant aux campagnes de prospection des 2 dernières années :
    – nom, prénom et adresse postale du prospect
    – résultat de la prospection (a répondu/n’a pas répondu)
    – données socio-démographiques disponibles (variables selon le fichier d’origine du prospect).
    600 000 adresses ont ainsi été centralisées.
  2. Enrichissement des données individuelles par des données géomarketing
    – à l’IRIS (profil socio-démographique du quartier)
    – et à la commune (type de commune)
    – ainsi que l’âge des prospects par score prénom
  3. Les données disponibles ont été divisées en deux parties :
    – une base d’apprentissage (400 000 individus) pour la construction du modèle de score
    – une base de test (200 000 individus) pour tester les performances du modèle obtenu
  4. Le modèle a été estimé, et il est apparu que les variables ayant une influence significative sur le fait de répondre à l’offre de la DMGM étaient l’âge, le sexe, la taille de la commune, le département et le type de quartier.
  5. Le modèle a ensuite été appliqué aux adresses de la base de test, afin d’évaluer sa capacité à détecter les répondants réellement enregistrés durant les campagnes. Le modèle s’étant avéré performant, les adresses de prospects louées ont ensuite été scorées à l’aide du modèle. Ainsi, seules les adresses présentant un niveau élevé de probabilité de réponse favorable sont désormais sélectionnées.
Etape 2 : un meilleur ciblage

Lors de la campagne de prospection suivante, l’ensemble des adresses potentiellement exploitables (1 million) ont été scorées. Seules les 300 000 adresses présentant les notes de score les plus élevées ont été sélectionnées.

Etape 3 : le bilan des actions mises en œuvre

Le taux de retour global des campagnes de prospection de l’entreprise est passé de 1% à 1.8%. Sur le segment des 50 000 meilleures adresses (scores les plus élevés), le taux de retour est aujourd’hui de 2.3%.

En conclusion

Fichiers clients, données off line, on line, open data, social data, objets connectés… Les données sont partout, multiples, complètes, et de plus en plus faciles d’accès dans leur état brut. Mais c’est bien le Data Mining qui les rend intelligibles et intelligentes. Pourquoi ? Parce qu’il est au centre de la transformation des données en réponses marketing concrètes, rationnelles et mesurables.

 

Philippe Nanopoulos
Philippe Nanopoulos
Philippe Nanopoulos est Responsable scientifique du Pôle Connaissance Client chez Base Plus.
Par ailleurs, il conseille entreprises privées et organisations publiques depuis 20 ans sur la chaîne de valeur des données clients (collecte, stockage, organisation, analyse et diffusion).
Enseignant-Chercheur à l’Ecole de Management de Strasbourg (Université de Strasbourg) au sein du Département Marketing.
Les informations collectées par la Société Base Plus doivent lui permettre de répondre à votre demande de renseignements. Les informations marquées d’un astérisque sont obligatoires et les autres facultatives sans quoi nous serions dans l’impossibilité de vous apporter le service escompté.
Vos informations sont à destination de la direction, du service technique, du service commercial.
Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée en 2004, vous bénéficiez d’un droit d’accès et de rectification aux informations qui vous concernent, que vous pouvez exercer en adressant votre demande par courrier postal à l’adresse suivante :
Base Plus
13 rue Jacobi Netter
67200 Strasbourg
Merci de joindre une copie d’une de vos pièces d’identité à votre demande.
Vous pouvez également, pour des motifs légitimes, vous opposer au traitement des données vous concernant.