Sirius, une solution libre et open source pour s’attaquer à Siri, Google Now, Cortana, …3 minute(s) de lecture

Parmi les fonctionnalités qui ont le vent en poupe on retrouve de nos jours les assistants personnels virtuels. Pas un fabricant d’OS ne laisse ce domaine vide de tentatives, tous souhaitent apporter une solution pour tenter d’y répondre. Apple propose Siri pour iOS, Google intègre Google Now dans Android, Microsoft développe Cortana pour Windows. Les grands groupes tels que Amazon se lancent également dans l’aventure avec Echo. Chez les amateurs on retrouve des solutions superbes avec S.A.RA.H. ou encore L.I.S.A. par exemple. Les universitaires ne sont pas à la traîne non plus comme le montre le projet Sirius.

sirius-tx

Sirius est une solution open source, permettant d’installer chez soi un assistant personnel complet. Elle intègre un client qui permet de collecter les ordres et un serveur qui permet de les traiter. Cette solution complète et autonome a pour but de proposer toutes les fonctionnalités des IPA ou Intelligent Personal Assistant. On les connait via leur implémentation sous la forme de Siri dans les appareils Apple, ou Google Now sous Android. Sirius implémente les fonctionnalités de base des IPA tels que la reconnaissance vocale, la reconnaissance d’images, le traitement du langage naturel ou encore les systèmes de questions réponses en vogue sur les smartphones.

Sirius est développé par le Clarity Lab de l’Universitée du Michigan. Les travaux autour de Sirius sont publiés à la International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS) qui se déroule en ce moment même du 14 au 18 mars 2015 à Istanbul en Turquie. Pour tous ceux qui ne peuvent pas s’y rendre pour faire connaissance avec Sirius , la publication peut être consultée car elle a été mise en ligne.


sirius-architecture

Sirius est donc un système informatique open-source avec lequel vous pouvez interagir à la voix ou via une image interposée. Il est conçu pour être inclus en tant qu’ “assistants personnels intelligents” dans une nouvelle génération dispositifs “wearables”. Il pourrait également avoir une incidence dans l’infrastructure des centres de données pour pouvoir lui apporter les ressources de connaissances nécessaires. Sirius a été conçu comme une application robuste qui collecte les instructions ou questions vocales, les interprète et y répond avec des mots prononcés dans la langue d’origine.

Ce qui différencie Sirius des solutions commerciales déjà en place c’est quelle n’est pas dépendante de la plateforme matérielle et qu’elle ne demande pas de contreparties commerciales pour être opérationnelles. C’est le principe du libre. Sirius est gratuit. Son côté open source permet à tous de récupérer le code informatique de tous le projet dans le but de l’utiliser tel quel ou bien afin de le modifier pour le personnaliser entièrement.

endtoend21-1024x309

Les sources de ce système Open Source sont disponibles sur le site de Sirius ou tout simplement sur GitHub. Le système n’en est qu’a ses débuts et est loin d’un produit qui peut être mis tel quel entre toutes les mains. Pour le mettre en place il faut clairement avoir de sérieuses compétences en informatique. Mais si les souhaits des concepteurs sont exaucés on pourrait voir arriver sur le marché des solutions utilisant leurs travaux. Sirius, en tant que solution académique sérieuse s’est ouvert un bel avenir.

La vidéo ci dessous vous permettra de faire connaissance avec Sirius:

Et pour finir voici une démonstration en ligne de commande de ce projet :

3 Comments

  1. Darkjeff said:

    Bonne nouvelle

    Malheureusement c’est basé sur pocketsphinx pour lequel il faut un model de reconnaissance vocale en français. J’en ai trouvé aucun de bon gratuit, la plupart sont des solutions commercial. SARAH a encore de beau jour devant elle.

    17 mars 2015
    Reply
    • idem2lyon said:

      Le gros problème de sarah…c est windows… Alors que lisa est unix 😉 tant que sarah restera windows, elle decollera pas

      18 mars 2015
      Reply
      • Darkjeff said:

        Je suis d’accord avec toi windows est un problème mais pas le plus gros.

        Pour lisa, j’ai voulus le tester mais la doc est vraiment pas bonne. De plus c’est pareil soit tu utilise pocketsphinx soit un service en ligne. Dans un cas tu as pas les modèle acoustique et dans l’autre tu as la latence.

        Les softs qui sont derrière n’ont rien de révolutionnaire, c’est une requête -> une action. C’est le client, la capture et la reconnaissance qui saura faire sortir un produit du lot. Et là on à rien pour le moment qui peut être local.

        18 mars 2015
        Reply

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Prouvez que vous êtes humain: * Time limit is exhausted. Please reload CAPTCHA.