Sirius : la version open source de Siri d’Apple

Les assistants vocaux personnels ont le vent en poupe. On dénombre ainsi Cortana de Microsoft, Google Now de Google, Siri d’Apple, tandis qu’Amazon a lancé, aux Etats-Unis, Echo, un appareil intégrant une telle technologie.

Mais il faut maintenant ajouter Sirius, développé par des chercheurs du Clarity Lab de l’Université du Michigan. Ils bénéficient du soutien financier de Google, ARM, la DARPA (Defense Advanced Research Projects Agency) et la NSF (National Science Foundation).

Jason Mars, le professeur à la tête du projet, le décrit comme une « version open source de Siri d’Apple ». N’importe quel développeur peut ainsi contribuer au projet déposé sur GitHub, un site d’hébergement permettant justement de gérer le développement collaboratif du code.

Sirius a été présenté (PDF de l’article) le 14 mars dernier à Istanbul dans le cadre de la conférence ASPLOS (Architectural Support for Programming Languages and Operating Systems). S’il s’apparente à Siri et aux autres assistants virtuels, il offre toutefois des possibilités absentes de ces assistants. On peut ainsi prendre une photo, la lui soumettre et poser des questions à son sujet.

« Ce que nous avons fait avec Sirius, c’est repousser les limites de l’assistant personnel intelligent traditionnel », déclare Johann Hauswald, doctorant au Clarity Lab de l’Université du Michigan. « Non seulement vous pouvez interagir avec votre voix, mais vous pouvez aussi poser des questions sur ce que vous voyez, ce qui constitue une nouvelle façon d’interagir avec ce type de dispositif. »

Sirius est distribué sous licence BSD, ce qui signifie qu’il peut être utilisé gratuitement et sans restriction. Il pourra même intégrer un autre logiciel propriétaire.

S’il fonctionne actuellement sous Linux (il est testé sur des PC évoluant avec la distribution Ubuntu), il pourra être porté vers d’autres environnements pour tourner sur des smartphones ou encore des appareils de type wearable (smartwatch par exemple).

L’une des vocations de Sirius est d’être utilisé pour explorer les capacités des assistants virtuels. Il leur permettra également de mesurer les futurs besoins en termes de data centers pour prendre en charge l’essor des assistants personnels qui exploitent le cloud. Les appareils à porter sur soi (« wearables ») qui exploitent ce type d’assistants virtuels devraient effectivement se vendre à près d’un demi-milliard d’unités par an d’ici 2018 selon les analystes.

Open source, Sirius l’est jusqu’au bout de son code, en étant composé d’autres programmes eux-mêmes open source, ce qui en fait un véritable patchwork. Ainsi, pour la reconnaissance vocale, Sirius utilise les programmes Sphinx de l’Université du Michigan, Kaldi de Microsoft Research ainsi que le projet allemand « RASÉ » de RWTH Aachen.

La reconnaissance des images est basée sur l’algorithme SURF de la société suisse Kooaba (récemment acquise par Qualcomm), lequel est également exploité par le super-ordinateur Watson d’IBM. Pour répondre aux questions, Sirius utilise un système baptisé OpenEphyra également développé par des chercheurs de Carnegie Mellon.

Afin de faire fonctionner Sirius, il est nécessaire de télécharger la suite intégrale, un tutoriel expliquant comment utiliser l’ensemble.

Si le projet est séduisant, d’autres initiatives comparables ont déjà vu le jour. C’est le cas de JuliusJS, qui n’a toutefois guère plus évolué depuis maintenant 8 mois et semble donc abandonné.

(Crédit photo et vidéo @Université du Michigan)