Si le big data était un iceberg, les données non structurées en seraient la partie immergée. Tweets, posts Facebook, appels au service client ou encore vidéos YouTube : elles représentent la très grande majorité des informations collectées par les entreprises. Une ressource extrêmement précieuse à condition de se donner les moyens de l’exploiter.

« 90 % de la data disponible dans le monde a été générée au cours des deux dernières années », affirme John Kelly, senior vice-président d’IBM. « Mais l’intelligence humaine ne croît pas à la même vitesse que la quantité de données », poursuit-il. « Ainsi, plus de 80 % des données générées aujourd’hui sont non structurées, et donc inexploitables, ce qui représente un immense gâchis. Nous ne voyons qu’une petite partie de la réalité. »

Les données non structurées proviennent en effet de nombreux acteurs (clients, prospects, salariés, internautes…), existent sous de nombreuses formes (textes, images, vidéos, sons…) et sont publiés sur de nombreux supports (articles de blog, fils Twitter, posts Facebook, réclamations téléphoniques auprès du service client...). Rien à voir avec les données structurées qui, elles, sont chiffrées et prévisibles : âge, code postal, chiffre d’affaires, historique des ventes…

En savoir plus : Comment le big data repousse les limites de la connaissance client

Décrypter les sentiments

Par leur variété et leur volume, les données non structurées sont certes difficiles à analyser, mais essentielles pour améliorer la connaissance client. Des solutions automatiques existent pour exploiter cette manne insoupçonnée. Analyse linguistique et text mining se révèlent en effet précieux dans cet exercice. Ils permettent de reconnaître les mots et d’expressions soigneusement choisis pour décrypter les sentiments exprimés par l’internaute, le client ou le prospect.

Outils d’analyse sémantique

Chaque mois, ce sont plus de 20 000 messages captés : e-mails bien sûr, mais aussi messages collectés à l’accueil ou par les chefs de rayon (les notes manuscrites représentent 25 % de la collecte). Les informations sont ensuite consolidées dans une base de données qui nourrit un outil d’analyse sémantique. Celui-ci permet d’améliorer sensiblement le service client en Le géant de la grande distribution Auchan fait figure de précurseur dans leur utilisation. Il a commencé dès 2011 à analyser les messages laissés par ses clients dans 130 magasins, rapporte le site ITespresso détectant les opportunités de vente et en faisant remonter les alertes concernant la qualité des produits.

Des plateformes CRM pour aller plus loin

Aujourd’hui, les plateformes CRM permettent d’aller plus loin en analysant les données massives des réseaux sociaux : posts Facebook, tweets et retweets, likes ou partages sur LinkedIn. Elles permettent de segmenter l’audience en fonction de ses interactions avec la marque et de ses prises de parole, puis de personnaliser les messages adressés. Aucun doute : les données non structurées ne demandent qu’à parler !