Pour gérer vos consentements :
Categories: Cloud

Sirius : la version open source de Siri d’Apple

Les assistants vocaux personnels ont le vent en poupe. On dénombre ainsi Cortana de Microsoft, Google Now de Google, Siri d’Apple, tandis qu’Amazon a lancé, aux Etats-Unis, Echo, un appareil intégrant une telle technologie.

Mais il faut maintenant ajouter Sirius, développé par des chercheurs du Clarity Lab de l’Université du Michigan. Ils bénéficient du soutien financier de Google, ARM, la DARPA (Defense Advanced Research Projects Agency) et la NSF (National Science Foundation).

Jason Mars, le professeur à la tête du projet, le décrit comme une « version open source de Siri d’Apple ». N’importe quel développeur peut ainsi contribuer au projet déposé sur GitHub, un site d’hébergement permettant justement de gérer le développement collaboratif du code.

Sirius a été présenté (PDF de l’article) le 14 mars dernier à Istanbul dans le cadre de la conférence ASPLOS (Architectural Support for Programming Languages and Operating Systems). S’il s’apparente à Siri et aux autres assistants virtuels, il offre toutefois des possibilités absentes de ces assistants. On peut ainsi prendre une photo, la lui soumettre et poser des questions à son sujet.

« Ce que nous avons fait avec Sirius, c’est repousser les limites de l’assistant personnel intelligent traditionnel », déclare Johann Hauswald, doctorant au Clarity Lab de l’Université du Michigan. « Non seulement vous pouvez interagir avec votre voix, mais vous pouvez aussi poser des questions sur ce que vous voyez, ce qui constitue une nouvelle façon d’interagir avec ce type de dispositif. »

Sirius est distribué sous licence BSD, ce qui signifie qu’il peut être utilisé gratuitement et sans restriction. Il pourra même intégrer un autre logiciel propriétaire.

S’il fonctionne actuellement sous Linux (il est testé sur des PC évoluant avec la distribution Ubuntu), il pourra être porté vers d’autres environnements pour tourner sur des smartphones ou encore des appareils de type wearable (smartwatch par exemple).

L’une des vocations de Sirius est d’être utilisé pour explorer les capacités des assistants virtuels. Il leur permettra également de mesurer les futurs besoins en termes de data centers pour prendre en charge l’essor des assistants personnels qui exploitent le cloud. Les appareils à porter sur soi (« wearables ») qui exploitent ce type d’assistants virtuels devraient effectivement se vendre à près d’un demi-milliard d’unités par an d’ici 2018 selon les analystes.

Open source, Sirius l’est jusqu’au bout de son code, en étant composé d’autres programmes eux-mêmes open source, ce qui en fait un véritable patchwork. Ainsi, pour la reconnaissance vocale, Sirius utilise les programmes Sphinx de l’Université du Michigan, Kaldi de Microsoft Research ainsi que le projet allemand « RASÉ » de RWTH Aachen.

La reconnaissance des images est basée sur l’algorithme SURF de la société suisse Kooaba (récemment acquise par Qualcomm), lequel est également exploité par le super-ordinateur Watson d’IBM. Pour répondre aux questions, Sirius utilise un système baptisé OpenEphyra également développé par des chercheurs de Carnegie Mellon.

Afin de faire fonctionner Sirius, il est nécessaire de télécharger la suite intégrale, un tutoriel expliquant comment utiliser l’ensemble.

Si le projet est séduisant, d’autres initiatives comparables ont déjà vu le jour. C’est le cas de JuliusJS, qui n’a toutefois guère plus évolué depuis maintenant 8 mois et semble donc abandonné.

(Crédit photo et vidéo @Université du Michigan)

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

2 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

3 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

4 semaines ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

1 mois ago