Omnipage et la reconnaissance pour Mac OS X

Cloud
Information - news

La reconnaissance de caractères a eu son heure de gloire, tout comme la reconnaissance vocale, une vogue liée à celle du bureau sans papier dans le courant des années 90 ! Les éditeurs présents sur le marché se battaient à coup de versions. Pour Scansoft, le fer de lance de la reconnaissance sur Mac, c’était Omnipage. Celui-ci revient sous X, après une traversée du désert, seulement sur le Mac.

Omnipage Pro. Le nom évoquera quelque chose aux utilisateurs expérimentés du Mac. Il s’agissait d’une des solutions permettant de faire de la reconnaissance de caractères au milieu des années 90 sur Mac. La dernière version de cette application ? Elle avait été numérotée 8… et datait de 1998 ! Scansoft, son éditeur n’a pas mis à jour l’application qui est pourtant passée aux versions 9, 10 et 11 sous Windows (voir fiche du 15 décembre 2001). Mais l’arrivée de Mac OS X semble changer la donne (voir édition du 12 décembre 2001) : l’éditeur d’Omnipage Pro lance une version pour X, annonçant une précision de reconnaissance inégalée. L’enjeu n’est pas négligeable : avec Mac OS X et ses technologies intégrées, le rêve d’un bureau « sans papier » refait surface. Il est soutenu en cela par une nouvelle mode, le knowledge management, une méthodologie de gestion des savoirs que les gourous du conseil mettent en avant pour réaliser des missions de veille au sein de l’entreprise, tout autant que pour éviter de perdre ses savoir-faire. Au coeur de ces préoccupations, la GED (Gestion Electronique de Documents), le Workflow et la gestion de la documentation font partie des outils émergents pour les petites entreprises et les professionnels indépendants, soumis à la demande de leurs donneurs d’ordres. Le logiciel de Scansoft vient combler un manque dans l’arsenal de solutions d’entreprise qui se met en place sur Mac OS X.

Omnipage Pro X, annoncé comme le logiciel de reconnaissance de caractères le plus utilisé au monde, se présente comme une évolution sensible de la version 8, qui s’avérait déjà assez précise, à condition de passer suffisamment de temps à apprendre au logiciel à reconnaître les polices de caractères les plus utilisées. De même, l’application était en mesure de présenter le texte reconnu en respectant la mise en page du texte numérisé. Pour Scansoft à l’époque, Omnipage Pro était déjà capable d’atteindre un taux de réussite de reconnaissance supérieur à 95 %. Sous Mac OS X, toutes ces fonctions sont améliorées d’environ 40 %. Un bel effort, qui améliore autant la reconnaissance de caractères que la reconnaissance des mots. La reconnaissance des contenus des feuilles scannées permet au logiciel de faire la différence entre images, tableaux, feuilles de calcul et texte, et de convertir la plupart des documents papier en fichiers électroniques. Un gain de temps et une amélioration de la productivité non négligeable. Ajoutez à cela le support natif du format PDF qui permet à Omnipage de transformer les documents PDF en documents Word ou Excel (entre autres, mais d’autres formats sont supportés), mais aussi, à l’inverse, de réaliser des fichiers PDF. Enfin, autres performances notables, retenez la capacité d’automatiser la reconnaissance de caractères ainsi que les opérations précédentes ou suivantes grâce au support d’AppleScript. De quoi mettre un terme aux tâches récurrentes habituellement trouvées dans des environnements de bureaux… Dernière fonction quelque peu « gadget » de l’application, la lecture à haute voix du texte reconnu : une fonction de lecture qui utilise les intonations et l’accent américain et qui s’avère inutilisable dans les faits !

La difficile reconnaissance… des scanners Agfa !

Sur un document de qualité moyenne, le logiciel s’avère capable d’en reconnaître dès la première passe pas loin de 90 %, sans que n’ait été utilisée la fonction d’apprentissage. Et encore, il ne bute pour les mots qu’il considère douteux que sur moins de 10 % d’entre eux. Au total, la première vérification que nous lui avons donnée à réaliser s’est avérée fiable à près de 98 %. Mais un temps de validation manuelle s’avère toutefois nécessaire dans la plupart des cas. Restent quelques difficultés à contourner pour le futur utilisateur de cette version, la principale étant la reconnaissance des scanners par le logiciel ! Sous Mac OS X, malgré une liste de seize scanners figurant sur la boîte, impossible d’amener l’application à communiquer avec l’Agfa e25 que nous avons utilisé. Vérification faite sur le site de l’éditeur : seuls les scanners de Canon, Epson, HP, Microtek, Mustek et Umax sont reconnus par le logiciel, ceux disposant d’un plug-in Photoshop ou encore ceux utilisant la technologie Twain ! Si ScanWise, le logiciel de numérisation d’Agfa, fonctionne bien sous X, impossible d’accéder au scanner depuis Omnipage ! Il faut donc jongler entre les logiciels pour réaliser la reconnaissance espérée ! Autres problèmes, plus bénins : les utilisateurs du Mac demeurent encore loin des facultés de la version 11 pour Windows, qui reconnaît plus de 115 langues, contre 59 pour la dernière version de Mac OS. Reste que globalement l’utilisation d’Omnipage Pro X s’avère aisée, d’une prise en main rapide et permet à l’utilisateur de ne pas se trouver confronté à une courbe d’apprentissage trop forte. Pour les connaisseurs, le passage se fera vraisemblablement sans anicroche, ni temps mort.