Vers un espéranto des documents informatiques

Cloud

Autonomy est une solution intégrée pour la recherche et le partage de documents électroniques au sein d’une base de donnée. La différence avec ses concurrents tient à son moteur qui analyse non seulement les termes mais aussi les contextes auxquels ils se rattachent.

On compare souvent la recherche d’une information au sein d’un réseau à celle d’une aiguille dans une botte de foin. Manque de pertinence des moteurs de recherche, syntaxe complexe et utilisant des opérateurs booléens pas forcément faciles à manier, les raisons de ce relatif manque d’efficacité sont nombreuses. Pour y remédier la société Autonomy, filiale de Neurodynamics, une firme créée par des chercheurs de l’université de Cambridge en 1991, propose une solution complète de gestion de document appelée Autonomy Knowledge Management. Constitué de plusieurs programmes agents dépendants les uns des autres, cet ensemble permet de trouver une information ou un document au sein d’une base de données indépendamment de son format de fichier ou même de la langue dans lequel il a été créé.Pour arriver à des résultats pertinents, Autonomy se base sur trois technologies complémentaires. Première d’entre elle, le moteur DRE (Dynamic Reasoning Engine) analyse les documents à la fois sur les mots mais surtout à partir du contexte duquel il ont été extraits. Autonomy en tire donc des concepts, des « idées », qu’il mettra en rapport avec la question posée par l’utilisateur en langage naturel. On est loin de la simple recherche du nombre d’occurrence d’un mot au sein d’un corpus de textes. Du fait de sa technologie tenant plus compte du contexte que du mot en lui même, cette solution accepterait même des requêtes formulées en langage familier ou en argot, dès l’instant qu’elles ne comportent pas de fautes d’orthographe. Le moteur existe déjà dans douze langues (dont le français, le japonais et le chinois). Mais il est possible de l’adapter « soi même » à une autre langue en donnant au programme un minimum de renseignements de vocabulaire et de syntaxe.Deuxième partie de la technologie Autonomy, la création de profils utilisateurs. Le programme analyse les pages Web et les documents visionnés par l’utilisateur et en déduit ses centres d’intérêts ainsi que ses préférences particulières. De là, il crée un fichier profil par utilisateur, dont il se servira pour affiner encore ses recherches. Selon les contextes, en effet, certains mots n’ont pas la même signification. Par exemple, selon que l’utilisateur sera amateur de danse ou de programmation, une recherche sur le mot « Java » ne doit pas renvoyer les mêmes réponses. L’utilisateur est aussi mis a contribution pour préciser les données de son profil. Le logiciel lui demande par exemple de stipuler les programmes qu’il utilise.Troisième module clé d’Autonomy, la fonction Update qui analyse les données incluses dans le fichier de préférence et interroge périodiquement les serveurs de l’éditeur pour se mettre à jour. Celle-ci touche autant les formats de documents (si une nouvelle version de Word est installée sur la machine de l’utilisateur par exemple) que les préférences de l’utilisateur si celles-ci ont changé au cours du temps. Du Push intelligent et réellement sélectif, en quelque sorte. Si elle n’en est plus à ses balbutiements, la technologie Autonomy n’est pas pourtant implantée sur tous les Intranet et portails d’entreprise, loin de là. Mais des sites comme celui de BBC News Online, le site d’information en ligne de la vénérable institution britannique, utilise déjà le procédé avec une certaine efficacité. Ainsi, ce site propose au visiteur d’effectuer une recherche d’un seul coup sur toutes les pages du sites, rédigées pourtant en plusieurs langues. Autre avantage de cette technologie, si on pose la question « Who is Bill Gates » au moteur de recherche, il ne faut descendre qu’à la sixième occurrence pour trouver une page avec un portrait du patron de Microsoft. Formulée de la même façon avec n’importe quel autre moteur, cette question affichera des milliers de réponses menant à des milliers de pages, la plupart totalement hors du sujet mais comprenant les termes « Bill » et « Gates ».Aussi impressionnante qu’elle puisse paraître, la technologie d’Autonomy reste encore très chère et s’adresse donc d’abord aux sites portails qui veulent offrir à leurs visiteurs un moteur de recherche un peu plus développé que la moyenne. Une licence leur en coûtera pas moins de 25 000 dollars.Pour en savoir plus : * Le site d’Autonomy * Le site de Neurodynamics