Après le langage, la vision fait partie du nouveau terrain d’apprentissage des machines pour exploiter les richesses des données non structurées. Comment les machines décryptent-elles les images ? On vous présente des exemples d’applications pour les marques.

La reconnaissance visuelle : un large champ de manœuvres

De l’identification d’objets sur des photos à l’interprétation des émotions lues sur le visage d’un individu, la reconnaissance visuelle embrasse un large spectre de développements technologiques autour du traitement de l’image. Grâce à la puissance de l’intelligence artificielle et sa capacité d’analyse du big data, les images (en 2D, en 3D ou captées en live) se mettent à parler et livrent des informations utiles pour une foule d’applications.

Pour en savoir plus : Big data, data mining, machine learning et business intelligence ?

La reconnaissance visuelle commence d’ailleurs à affecter toutes les sphères de la vie quotidienne :

  • la sécurité : à travers des systèmes de reconnaissance biométrique comme la confirmation de paiement en magasin par « selfie » lancée par Mastercard en 2016,
  • l’aide à la personne : l’application Horus décrit à son utilisateur malvoyant son environnement direct, une technique également utilisée par Facebook (« Image may contain… ») et Twitter pour décrire les images publiées sur leur réseau social,
  • la robotique domestique : en phase de test, le robot chariot wiiGO a fait son apparition dans un magasin Auchan de la périphérie lilloise fin 2016 et suit les clients en situation de handicap dans les allées de l’hypermarché,
  • les transports : les voitures autonomes utilisent déjà depuis des années des systèmes de reconnaissance d’obstacles.

Quand l’IA décrit les photos sur Facebook. Photo : GNM. Source : The Guardian, “Image may contain... cat?’ – now Facebook can talk you through your photos”


Le potentiel d’usage de la reconnaissance visuelle s’étend au fur et à mesure des avancées de l’IA et notamment du deep learning, cette capacité d’auto-apprentissage des programmes. Et si des erreurs subsistent, notamment dans la différenciation d’objets en 3D, les progrès sont continus.

Des enjeux multiples pour les marques et le commerce

Les marques s’intéressent de près à la reconnaissance visuelle. Premier usage : elle simplifie les parcours d’achat. C’est le cas de l’application Overlay qui permet à l’utilisateur de scanner avec son smartphone un produit dans un magazine de mode, puis de l’acheter en ligne. Pratique pour le consommateur, cette appli sert aussi au vendeur afin de recueillir des informations sur les habitudes de shopping et adapter ses offres.

En allant plus loin, la reconnaissance visuelle permet l’hyper-personnalisation de la relation client. En 2016, Microsoft a développé la technologie open-source Realtime Crowd Insights : le sexe, l’âge et même les émotions de chaque client en magasin sont identifiés grâce à la reconnaissance faciale. Le vendeur dispose alors de précieuses informations pour orienter son discours commercial selon l’état du client...

« 34 ans, homme, surpris » : Realtime Crowd Insights est capable de détecter le sexe, l’âge et les émotions de vos clients. Photo : Microsoft. Source : Microsoft on Github


Salesforce n'est (évidemment) pas en reste. Lancé en en mars 2017, Einstein Vision est un ensemble d'API, intégrable à une app en quelques clics, qui permet d'allier reconnaissance visuelle et CRM. Pour quoi faire ? Identification de produits (si un client veut des informations ou savoir comment acheter un produit pris en photo par exemple), reconnaissance de marques pour les équipes marketing à l'écoute des réseaux sociaux, filtres d'analyse pour identifier automatiquement les leads les plus matures... Les possibilités sont immenses !

Nota bene : les robots n'arrivent pas (encore) à déceler l'ironie et le second degré. La prochaine fois que vous posterez un sourire moqueur, vous laisserez peut-être une IA perplexe... Pensez à elles.