Pour gérer vos consentements :
Categories: Cloud

Intelligence artificielle : des progrès pour la reconnaissance d’images

Dans le cadre de leurs travaux sur les réseaux neuronaux (inspirés du fonctionnement du cerveau humain), deux groupes de chercheurs indépendants ont franchi un nouveau cap en matière d’intelligence artificielle appliquée à la reconnaissance d’images.

Les équipes de Fei-Fei Li (université Stanford) et d’Oriol Vinyals (Google) ont développé un programme informatique capable de décrire le contenu de photos et de vidéos avec une précision sans précédent. Au-delà de la simple détection d’objets, la réflexion s’est concentrée sur l’identification de scènes grâce à la dimension de contextualisation.

Pour autant, il reste du chemin à parcourir. La machine fait certes (presque) aussi bien que l’humain pour reconnaître un groupe de jeunes jouant au frisbee, un cliché pris lors d’une épreuve de motocross, un troupeau d’éléphants dans la savane ou des pizzas posées sur une gazinière. Mais elle a encore du mal à déterminer si les deux joueurs de hockey présentés sur une image se disputent bien le palet ou s’ils se trouvent simplement sur le même plan. Quand à la photo d’un cerf-volant à l’effigie d’un monstre, l’ordinateur y voit un homme volant dans le ciel sur un snowboard…

Les avancées de Google – publiées sur arXiv.org, site d’hébergement de projets open source géré par l’université Cornell – et celles de Stanford (document PDF, 10 pages) pourraient tout de même permettre de qualifier, même approximativement, des milliards d’images et de vidéos disponibles en ligne. Ces dernières ne sont souvent associées à aucune légende, voire à aucun mot-clé, alors même que des moteurs de recherche comme Google s’appuient essentiellement sur la description pour le référencement.

A plus long terme, les perspectives s’élargiront probablement à la robotique, ainsi qu’à l’assistance aux personnes aveugles ou malvoyantes. On peut également attendre des implications dans le domaine de la vidéo-protection : en plus d’identifier des individus, il serait possible de déterminer d’éventuels comportements à risques. Autre application envisagée : une intégration dans les automobiles afin d’améliorer la détection de situations dangereuses (c’est actuellement le cas avec les radars à piétons et à cyclistes).

Google s’était déjà distingué sur la question de l’intelligence artificielle en dévoilant, il y a deux ans, un programme capable d’apprendre à reconnaître des photos… de chats. Pour ses nouvelles expérimentations, le groupe Internet a exploité conjointement deux types de réseaux neuronaux : l’un dédié à la reconnaissance de formes ; l’autre au langage humain. Son programme a été entraîné avec une série d’images légendées au préalable.

—— A voir aussi ——
Quiz ITespresso.fr : incollable sur la 3D ?

Crédit photo : artshock – Shutterstock.com

Recent Posts

Avec Phi-3-mini, Microsoft va-t-il convertir les PME à la GenAI ?

Microsoft lance Phi-3-mini, un petit modèle de langage (SLM) qui s'adresse aux entreprises ne disposant…

2 jours ago

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

3 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

4 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

1 mois ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago