L’intelligence artificielle is watching you : les nouveaux usages de la reconnaissance d’image

Rédigé le 11 janvier 2017 par | Nouvelles technologies Imprimer

Nous avons vu hier ce que l’intelligence artificielle (IA) est capable de faire en 2017, et ce qui relève encore du fantasme. Aujourd’hui, nous allons voir comment la reconnaissance d’image – un des domaines dans lequel l’IA excelle – peut être utilisée en pratique.

Un défi vieux comme l’informatique

Reconnaitre les choses « au premier coup d’oeil » est le propre de l’homme. Nous le faisons en permanence. En entrant dans une pièce, nous savons instantanément où sont les meubles, les autres humains et les éventuels animaux.

Mieux encore, nous sommes capables de savoir rapidement si une personne en face de nous est en train de rire, de pleurer, ou de regarder ailleurs.

Pour un ordinateur, une image n’est qu’une succession de points de couleur appelés pixels.

Depuis l’avènement de la photographie numérique, des algorithmes de plus en plus complexes ont été développés pour permettre aux machines de donner un sens à ces images.

Les progrès de la recherche fondamentale et l’augmentation des capacités de calcul de ces dernières années ont fait de la détection d’humains sur une image une tâche banale.

Les meilleurs algorithmes arrivent aujourd’hui à travailler en temps réel sur des vidéos, et s’offrent le luxe d’ajouter une touche de psychologie à la détection de visages.

Les scientifiques disposent en effet d’une bonne connaissance des expressions du visage en fonction des humeurs et des intentions – et ce, quel que soit l’âge de la personne et son origine.

Cette formidable base de données est désormais intégrée aux algorithmes haut-de-gamme. Autrement dit, un ordinateur peut savoir ce que vous avez en tête grâce à une simple caméra numérique.

Pourquoi est-ce important ?

Les machines sont, sans intelligence artificielle, aveugles à ce qui les entoure. Votre ordinateur ne peut se fier qu’à ce que vous lui indiquez explicitement avec le clavier.

Il se borne par conséquent à répondre à ce que vous lui demandez. C’est pour cela que les assistants virtuels ne sont aujourd’hui pas plus efficaces que les moteurs de recherche.

Un assistant virtuel capable d’interpréter de manière autonome les informations visuelles pourrait vous faire des suggestions de manière proactive.

Imaginez le cas de figure suivant : vous vous installez devant votre ordinateur en plein hiver. L’ordinateur détecte que votre température corporelle est plus élevée que d’habitude et que vos pupilles sont légèrement dilatées. En pleine épidémie de grippe, il pourra vous suggérer de vous ménager et de surveiller vos symptômes – avant même que vous ne réalisiez que vous couvez un virus.

Donner aux machines la capacité d’interpréter les images, c’est leur offrir la possibilité d’en savoir plus sur vous de manière non-intrusive et de développer un début d’empathie.

Quand les machines vous comprennent sans un mot de votre part

Vous trouvez impressionnante la capacité des moteurs de recherche à contextualiser vos requêtes et à tout savoir sur vous ? Ils se fondent simplement sur les informations que vous leur fournissez lorsque vous surfez sur Internet.

Désormais, il faudra vous habituer aux machines qui vous catégorisent et anticipent vos besoins sans vous connaître.

La chaîne de fast-food Kentucky Fried Chicken a d’ores et déjà commencé à mettre en place ce type d’IA dans ses bornes de commande automatisées en Chine. Lors de l’arrivée d’un client, la borne scanne rapidement son visage. Forte de l’expérience de millions de repas commandés, l’IA intégrée est capable de proposer le repas qui sera le plus à même d’intéresser le consommateur.

Il est évident qu’un adolescent affamé, une mère de famille et un retraité ne commanderont probablement pas les mêmes produits. Un serveur de restaurant sait au premier coup d’oeil catégoriser les clients lorsqu’ils se présentent et adapte ses suggestions en conséquence. Grâce à l’IA, les bornes automatiques sont aujourd’hui capables de faire de même.

L’intérêt pour le commerçant est évident : un consommateur à qui l’on propose des produits adaptés à ses attentes est plus à même d’augmenter son panier d’achat.

KFC - reconnaissance image
La borne intelligente de KFC
Crédits : Baidu

Un tel service ne peut fonctionner qu’avec une solide base de données pour catégoriser l’utilisateur parmi les millions de profils pré-identifiés. Ce n’est donc pas pour rien que l’élaboration de cette borne a été menée en collaboration avec Baidu, le moteur de recherche chinois concurrent de Google.

Outre son intérêt commercial, la classification comportementale par analyse d’images est un enjeu de sécurité publique. Avec la multiplication exponentielle des caméras de vidéosurveillance, les autorités disposent d’un volume de données colossal qui n’est malheureusement exploité qu’en cas de problème.

A moins d’avoir une personne 24h/24 derrière chaque caméra, les vidéos ne peuvent être utilisées qu’a posteriori pour identifier les personnes présentes sur les lieux des incidents et déterminer leur rôle.

Avec les nouvelles techniques d’analyse comportementales en temps réel, les logiciels branchés sur les circuits de vidéosurveillance proposent une analyse prédictive aux agents de sécurité pour concentrer leur attention sur les personnes à risque.

L’aéroport international de Schiphol et la SNCF expérimentent des dispositifs de détection de comportement suspect depuis quelques mois.

Les premiers retours d’expérience montrent que les algorithmes pêchent encore par excès de paranoïa. L’IA installée derrière les caméras a tendance à catégoriser de très nombreuses personnes comme « à risque » et le travail des agents de sécurité n’est pour l’instant pas facilité par l’installation de ces systèmes.

L’effort de recherche est pourtant conséquent. Les fréquentes publications scientifiques sur le sujet laissent espérer de meilleures performances dans un futur proche.

L’IA peut vous sauver la vie

Le domaine de la santé s’ouvre également à l’IA pour les diagnostics. Avec les progrès de l’imagerie médicale, radiographies et IRM sont devenues banales dans l’arsenal de recherche de pathologies.

La multiplication des images pose toutefois le même problème qu’en matière de vidéosurveillance : le maillon faible reste l’humain qui va interpréter ces données. Les spécialistes n’ont pas tous la même manière de lire les images, sont souvent sujets à la fatigue et toujours au manque de temps.

Par conséquent, l’amélioration des techniques d’imagerie ne conduit plus à l’augmentation de la précision des diagnostics. Au contraire, il est plus en plus fréquent que les médecins soient contraints de choisir quelles images consulter avec attention quitte à en délaisser d’autres.

Les nouveaux algorithmes d’intelligence artificielle permettent de remplacer l’oeil du médecin pour faire un premier tri dans les données. Il y a quelques années, ces algorithmes étaient connus pour être médiocres. Depuis quelques mois, des publications scientifiques confirment que les meilleurs logiciels permettent autant de détection qu’un oeil exercé.

Il est certain que l’interprétation des images fera rapidement partie des fonctions de base des machines d’imagerie. Le temps perdu par les spécialistes à cette tâche fastidieuse ne sera plus qu’un mauvais souvenir.

Des équipes de recherche s’intéressent même à la détection de microlésions cérébrales par intelligence artificielle. Dans ces pathologies, l’imagerie n’est aujourd’hui pas exploitée par les médecins par manque de temps. Avec un traitement automatisé des données, de nouveaux diagnostics en amont pourront voir le jour et révolutionner la manière dont les atteintes cérébrales sont prises en charge.

En ce début 2017, plusieurs start-ups prometteuses élaborent des logiciels de traitement automatisé d’imagerie médicale. Nous aurons l’occasion d’aborder ce sujet de nouveau si elles parviennent à transformer ces produits en réalité commerciale dans les prochains mois !
[NDLR : En attendant, les derniers progrès de l’intelligence artificielle sont à retrouver, dès à présent, dans NewTech Insider]

 

Mots clé : -

Etienne Henri
Etienne Henri

Etienne Henri est titulaire d’un diplôme d’Ingénieur des Mines. Il débute sa carrière dans la recherche et développement pour l’industrie pétrolière, puis l’électronique grand public. Aujourd’hui dirigeant d’entreprise dans le secteur high-tech, il analyse de l’intérieur les opportunités d’investissement offertes par les entreprises innovantes et les grandes tendances du marché des nouvelles technologies.

Laissez un commentaire