Big data ou bide data ?
Avec
l’apparition de la promesse big data, tout le monde se remet à parler de la
donnée, de son importance et des moyens humains, techniques ou financiers à mettre
en face de ce nouveau graal. Reposons les pieds sur terre et revenons quelques
minutes aux basiques.
Small data is beautiful
- Qui sont nos consommateurs, nos
adhérents, nos membres ?
De quelles données sociodémographiques disposons nous ? Dans quel état sont nos données « signalétiques » ? Ces données forment le socle de base de notre relation client, or, de quelles informations dispose-t-on ? Les coordonnées sont-elles complètes, propres et à jour ? Dispose-t-on des e-mails de nos membres ? des numéros de mobiles ? A-t-on fait signer les optin nécessaires en séparant les medias et les types de messages (gestion du compte, offres marketing etc…) ?
- Qu’ont-ils acheté, utilisé,
consommé ?
Quelles sont les données comportementales disponibles ? Sont-elles propres ? Quelle est leur granularité ? Dispose t’on des données du total ticket ou du détail du panier qu’il s’agisse de produits achetés ou de services comme la musique ou un film. Sur quelle longueur d’historique porte la profondeur de ces données ?
- Ou en sont-ils de leurs points ?
Identifie-t-on les gains des différents types de points : points standard ou bonus ? Conserve-t-on la consommation de ces points et le type de primes commandées ?
- Quelles propositions ont-ils
reçu ? Ce qui les a intéressés ?
Peut-on connaitre les communications reçues, la pression commerciale ? Peut-on déterminer leurs centres d’intérêt à travers les communications ouvertes, les coupons consommés ?
- Quels contacts avons-nous avec
eux ?
Les contacts entrants – téléphone, mails, courriers, visites en magasin ou en agence, recours au SAV - et sortants, leur nature et les messages échangés ? - Au final
- Dispose-t-on de données
synthétiques résumant la valeur, le potentiel et le profil du client
?
- A-t-on mis en place des scores
d’appétence ou d’attrition ? Des segmentations ?
- L’ensemble de ces données sont
elles interfacées et regroupées dans une vue 360 ?
A ce
premier lot, de nouvelles données sont venus s’adjoindre
- Avec le web, se sont ajoutées les données de circulation, les « web-analytics » : Historise t’on ces données ? Les membres, porteurs, adhérents sont-ils identifiés ? Connaît-on le chemin suivi par le client sur le site web? les produits qu’il a consultés ? Peut-on croiser ces informations avec les données comportementales (achat, consommation) ?
- Avec le mobile c’est l’explosion les données de localisation. Ces données existaient déjà pour la personnalisation de certains sites mais la connexion en mobilité via notamment les applications amplifient largement ce phénomène.
- La vague suivante provient des réseaux
sociaux et des données liées aux profils et activités sur ces
médias et enfin dernière vague en date; le « quantified-self ».
Viendront ensuite le M2M et les objets connectés.
Enfin, autour
de ces données « personnelles » viennent s’adjoindre
des données qu’on peut qualifier de « contextuelles ».
Ces informations « générales » sur l’environnement global, s(er)ont
portées par la vague de l’open data.
- En fait on fait déjà de l’open data sans
le savoir : Le géomarketing avec l’analyse de la composition des
zones géographiques (zones de chalandises de magasins ou recherche
d’implantation, qualification de bases clients etc…) ; l’intégration
de la météo dans les prévisions de chiffres d’affaires ou les animations
commerciales ; la prise en compte de la circulation sur les GPS (et
avant ça via bison-futé) sont d’ores et déjà autant des utilisations
courantes de l’open data.
Big data,
big browser.
La masse
d’informations collectées que l’on peut regrouper sous le terme de big data se
caractérise par sa volumétrie explosive collectées, leur variabilité à savoir
l’extrême diversité des formats et contenus, et la vitesse de traitement
nécessaire
- Volume : Les volumétries présentent une progression exponentielle. Le nombre de variables suivies et donc d’informations captées a augmenté drastiquement (comportement, attitudes, communications etc..). Nous sommes, ainsi, passés d’un « bas de ticket » aux détails du panier, des produits achetés aux produits consultés, de mesures ponctuelles (achat) à des mesures continues (localisation).
- Variabilité : Au sein de ces différentes données, on devra donc intégrer d’une part des données dites structurées comme les adresses, les transactions, les connexions, etc.. et d’autre part les données « non structurées » comme des textes de mails ou de courrier, des posts ou commentaires sur les réseaux sociaux. Sans oublier, bien sur, le son, les images et les vidéos.
- Vitesse : Enfin, les flux
entrants d’alimentation de données, provenant des capteurs clients, sont
passés d’un mode batch au temps réel. De même les flux
« sortants » que nous émettons vers le consommateur sont eux
aussi passés en temps réel pour recommander un produit en fonction du
produit regardé sur un site, pour imprimer un coupon en caisse qui tienne
compte du caddie qui vient d’être payé, pour envoyer un message push sur
une application en fonction de la localisation du porteur.
Big
data ou smart data ?
·
Ces volumes, cette variabilité et cette exigence de temps
réel, mettent sous tension les moyens informatiques et statistiques d’analyse
de la data. La question se pose bien sur au plan informatique du stockage de
ces données et des outils nécessaires pour traiter cette masse d’information.
·
Mais la question ne se pose t’elle pas avant tout au plan
data-analysis de la qualité des informations, de leur pertinence et de
l’utilité de ces différentes données pour créer de la valeur métier. Ne faut-il
pas aussi s’interroger sur l’utilisation faite aujourd’hui des données déjà
disponibles ? on parle maintenant d’’entreprise data-centric mais le
« data déluge » annoncé n’est pas déjà arrivé ?
·
Au-delà des déclarations, quelles capitalisations ont réellement été
faites sur les données collectées ? Combien d’opérations réellement ciblées,
d’offres différenciées, de communications segmentées s’appuient sur l’analyse des
comportements et l’évaluation des potentiels clients ? Combien de scores
d’appétence ou d’attrition ? Quelles mesures de la valeur client actuelle
ou évaluations de la valeur potentielle guident la politique
relationnelle ?