Bibliothèque numérique européenne : le Xerox Research Centre Europe contribue à l’accès multilingue

Mobilité

Le projet Cacao vise à favoriser une meilleure exploitation des fonds et des catalogues qui seront proposés via Europeana.

Dans le cadre des objectifs définis par le Conseil de l’Europe à Lisbonne en mars 2000, le projet Cross Language Acces to Catalogues And Online (Cacao) vise l’accès multilingue du contenu des catalogues et bibliothèques en ligne. Plus précisément, cet axe de recherche appartient au programme européen eContentplus dont l’objectif est de garantir la disponibilité de ces informations (cuturelles, éducatives et scientifiques). Et c’est le centre de recherche de Xerox Europe, basée à Grenoble (Isère), qui coordonne le projet.

Côté partenaires, l’opération Cacao réunit notamment l’Université libre de Bolzano (Italie), la Bibliothèque Kornicka (Académie des sciences, Pologne), la Cité des sciences et de l’industrie (France), l’Institut de recherches linguistiques (Académie des sciences, Hongrie), la Bibliothèque de Szechen (Hongrie) et la Bibliothèque universitaire de Göttingen (Allemagne).

« Nous ne sommes pas une bibliothèque et nous n’intervenons pas en tant que fournisseur de contenu », explique Frédérique Segond, chercheuse et directrice de l’entité Parsing & Semantics de Xerox Research Centre Europe. « Après une phase importante de numérisation et d’océrisation de ces institutions et bibliothèques, il convenait d’améliorer les outils qui donnent accès à leurs contenus et en permettent une meilleure utilisation et exploitation. » Sachant que l’on estime que les travailleurs du savoir passent jusqu’à 30 % de leur temps à rechercher les informations dont ils ont besoin.

Ces technologies issues de Cacao seront utilisées par EDL (European Digital Library) qui va devenir Europeana, la grande Bibliothèque Européenne (en fait, un réseau d’agrégation de bibliothèques sous la houlette de la Commission européenne). L’infrastructure issue de Cacao sera ainsi intégrée aux bibliothèques numériques ouvertes (Online Public Access Catalog ou Opac).

Appui sur des technologies Xerox

« Lorsque l’on effectue une recherche dans une langue donnée, celle-ci fonctionne sur la structure de la bibliothèque interrogée. Nous conservons la classification des diverses bibliothèques, mais à un mot clef peut succéder un autre ; les réponses sont fournies dans toutes les langues », explique Frédérique Segond.

« Les divers mots clefs utilisés dans les requêtes successives vont peut-être faire apparaître un nouveau lien. Ces mots sont peut-être reliés… Ces informations de back office sont donc transmises au bibliothécaire qui peut alors enrichir ou modifier sa catégorisation », poursuit-elle.

La recherche par mot clef s’élargit de fait par l’analyse de contenus sémantiques, analyse contextuelle qui relève des technologies Smart Document Management développées par le XRCE depuis sa création dans les années 90.

Inauguration d’Europeana en novembre

Ce projet CACAO, doté d’un budget de 1,3 million d’euros, s’échelonne entre décembre 2007 novembre 2009. Mais d’ores et déjà, une version 1 sera disponible en novembre prochain. A terme, le but est de créer la plus large agrégation de bibliothèques européennes.

Pour l’heure, Cacao va permettre la consultation du catalogue unique de cinq bibliothèques européennes, un embryon de la première bibliothèque numérique européenne qui a pour nom Europeana. Ce fonds numérique paneuropéen proposera deux millions d’objets numériques dès l’automne – dont des films, des photos, des tableaux…

C’est Viviane Reding, membre de la Commission européenne en charge des médias et de la Société de l’information, qui inaugurera ce service Web. Pour 2010, il est prévu que le catalogue propose six millions d’objets numériques…