Pour gérer vos consentements :

Salesforce creuse l’intelligence artificielle sous l’angle du résumé de texte

Le problème avec l’information, ce n’est plus d’y accéder, mais de s’y retrouver.

Ce postulat, on le doit à l’équipe de Richard Socher, « Chief Scientist » chez Salesforce depuis un peu plus d’un an, consécutivement à l’acquisition, par l’éditeur américain, de sa start-up MetaMind, spécialisée dans l’intelligence artificielle.

Avec deux de ses associés qui ont poursuivi l’aventure (Romain Paulus et Caiming Xiong), l’intéressé a planché sur une problématique liée à l’interprétation du langage naturel : le résumé de texte.

Les avancées technologiques réalisées dans le cadre de ces travaux portent essentiellement sur l’entraînement des algorithmes et sur la dimension de contexte. Elles permettront, selon Salesforce, d’améliorer la productivité de nombreux métiers, en synthétisant des chaînes d’e-mails, des articles d’actualité ou encore des évaluations de clients.

Chercher le contexte

À l’heure actuelle, les principaux algorithmes dédiés à la tâche fonctionnent soit par extraction, soit par abstraction.

Dans le premier cas, ils sélectionnent les phrases les plus pertinentes d’un document et les concatènent. La qualité des résumés qui en résultent est limitée, entre autres du fait de l’impossibilité d’utiliser des mots non présents dans le texte d’origine. L’algo a par là même tendance à paraphraser.

Le modèle d’abstraction supprime cette barrière, mais il est plus difficile à mettre en œuvre : il n’est pas rare de trouver des phrases incohérentes, des répétitions, voire des éléments sans intérêt.

Les réseaux neuronaux aujourd’hui exploités pour représenter des textes sous forme informatisée examinent les mots à la suite, l’analyse de chaque terme dépendant globalement du précédent.

MetaMind se base sur ce principe, mais introduit un deuxième réseau neuronal qui parcourt la séquence de droite à gauche, en plus de celui qui l’interprète dans le sens « conventionnel ».

Une technique dite d’« attention temporelle » est mise à contribution en parallèle pour permettre à l’algorithme de chercher, à chaque fois qu’il produit un mot, du contexte dans d’autres parties du document. Ce qui a notamment pour effet de minimiser les répétitions.

De la partie au tout

Qu’en est-il en matière d’entraînement de l’algo ? Communément, on sélectionne un résumé de référence et on compare, mot par mot, ce que produit la machine.

Comme le fait remarquer MetaMind, cette approche a ses limites : deux personnes peuvent synthétiser un texte de manière très différente (style, syntaxe, vocabulaire…) sans pour autant que leur production soit de mauvaise qualité.

Dans cette optique, il est fait appel à une technique d’apprentissage « par renforcement » : on laisse l’IA faire sa synthèse, puis on la compare à un résumé de référence. Selon le score obtenu, l’algorithme classe l’expérience comme « à oublier » ou « à reproduire ».

L’évaluation est réalisée sur la « prestation d’ensemble ».

S’étant aperçus que les résumés les mieux notés n’étaient pas forcément les plus lisibles, les chercheurs ont opté pour une combinaison des deux méthodes, la première assurant une lecture plus fluide.

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

2 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

3 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

4 semaines ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

1 mois ago