Intelligence visuelle, le couplage de la vidéo et de l’intelligence artificielle

Le par

, , ,

A l’occasion du Cognitive Services Meet-Up organisé par la Société Générale le 22/05/2018, une présentation sur l’utilisation de l’analyse vidéo couplée à l’intelligence artificielle a retenu mon attention.

Nota : Le présent article ne constitue pas un compte-rendu de cette présentation et n’est pas non plus un article commercial vantant les mérites du fournisseur concerné, n’ayant aucun lien ni intérêt avec la société qui présentait. Il s’agit essentiellement d’un commentaire libre de ce qui me paraît le plus important et susceptible de généralisation (notamment via d’autres offres du marché)

En résumé

Les solutions intelligentes exploitant les vidéos ne sont pas réservées aux professionnels de l’image mais peuvent avoir des applications « classiques » pour des entreprises de tous secteurs : Aide à la vente, optimisation d’espace, sécurisation, etc. La question du ROI sera clef dans la décision d’y faire appel ou non.

Créer de l’intelligence visuelle

Fujitsu a présenté des applications basées sur la vidéo en temps réel ou en différé. Ils ont développé une solution qui « suit » les déplacements des personnes ou des voitures dans un espace donné et permet d’en faire une analyse circonstancielle, voire comportementale. Les applications allaient de l’analyse des déplacements dans une station-service au comportement des personnes dans un magasin (la même personne s’est arrêtée devant le stand A puis le stand B et a finalement acheté un produit du stand C, etc., elle était seule, en famille…). D’autres applications pouvaient concerner des aéroports ou gares ferroviaires : détecter des comportements suspects du côté Big Brother mais aussi retrouver un enfant perdu du côté Bonne Fée. Il y avait aussi du Smart Parking pour trouver les places libres et plein d’autres applications.

D’après Fujitsu, la solution anonymise les données (« compatibilité RGDP » dixit) et ne retient que des typologies de comportement pour permettre de mieux adapter l’offre commerciale aux comportements effectifs des clients (sauf notamment dans le cas de l’enfant perdu qui fait l’objet d’une accréditation par la police).

On imagine assez bien de très nombreuses applications potentielles de cette technologie, applications qui peuvent être colorées Big Brother ou Bonne Fée selon les cas. L’analyse des déplacements et des points d’arrêts des personnes dans un lieu donné est évidemment une formidable source d’information sur ce qui les intéresse un peu, beaucoup ou pas du tout, sur ce qui peut les déranger ou les gêner, sur l’impact d’une animation, etc.

Une fois ces comportements enregistrés, mesurés et cartographiés, il faudra beaucoup d’intelligence humaine pour les exploiter correctement, notamment pour détecter des signaux faibles « invisibles à l’œil nu » car la détection automatique d’une queue devant le marchand de glaces les jours de forte chaleur n’a aucun intérêt… On peut alors agir soit a posteriori (par exemple, une mise en place différente optimisée par rapport aux comportements), soit en temps réel (message publicitaire instantané par exemple).

Pas d’aveuglement face à l’intelligence visuelle

La question importante qui reste ouverte est néanmoins la suivante : Compte-tenu du coût de mise en œuvre d’une telle solution (quel que soit le fournisseur, Fujitsu ou autres) y compris des coûts internes non négligeables, les gains que l’entreprise peut espérer seront-ils à la hauteur de l’investissement ? C’est loin d’être évident et ce ROI devra être étudié avec soin. L’histoire ne dit pas qu’elle a été le verdict de la Société Générale par rapport à ces propres usages…

Outre la question de l’investissement temps que représente de tels projets, cette question du ROI de telles solutions me semble être une question cruciale et susceptible de freiner les intentions de mise en œuvre.

Intelligence visuelle, et mon entreprise ?

Tout dépend !

De fait, cette technologie amène à se poser des questions là où on ne s’en posait pas jusqu’à maintenant. Se poser des questions est pertinent si quelque part dans vos processus, il existe un comportement collectif spatial d’individus ou de véhicules ou d’objets autonomes ; j’exclus ici les animaux, les oiseaux, les insectes ! mais j’ai l’impression que ça fonctionnerait aussi si besoin était, chaque « élément » étant suivi individuellement dans son parcours, une fois qu’il est identifié en tant qu’ « image mouvante ».

Analyser ces comportements individuels dans les lieux qui m’intéressent (agence, allée commerciale, magasin, stade, parking, lieu de restauration, piste de ski, parc d’attractions…) serait-il utile à mieux comprendre :

  • Pourquoi un visiteur s’attarde mais n’achète rien ?
  • Quel peut-être un élément participant positivement à un acte d’achat ?
  • Y a-t-il des comportements par type : femme seule, homme seul, femme avec enfants, famille, etc.
  • Des mesures de prévention récemment mises en place diminuent-elles les occurrences de situation dangereuse ?

En bref, cette connaissance peut -elle m’apporter des informations complémentaires à ce que je sais déjà (ou que le bon sens me dicte) et si oui, serai-je capable d’en tirer parti ? Si la réponse est oui, alors se posera la question du ROI. Evidemment, cette question du ROI sera abordée très différemment selon qu’on est dans une logique de sécurité ou une logique d’augmentation du chiffre d’affaires.

Laisser un commentaire

En déposant un commentaire, vous acceptez notre politique de données personnelles.

Partagez
Tweetez
Partagez