Nuance Mix, commande vocale universelle pour l’IoT

Aujourd’hui, on peut faire beaucoup de choses grâce à la commande vocale : s’informer, paramétrer des actions, prendre des notes… Mais l’inconvénient des technologies actuelles est que celles-ci sont pour la plupart dépendantes d’une application particulière.

Apple, Microsoft et Google proposent cette solution dans leurs applications respectives Siri, Cortana et Now. Mais si vous souhaitez dicter des commandes à une autre application… C’est tout de suite plus compliqué. D’une part, chaque éditeur peut rarement se permettre de développer son propre service de commande vocale, d’autre part ces services n’y proposent aucune réelle solution.

Le problème de la commande centralisée

Il existe déjà quelques idées : vous pouvez effectuer quelques actions externes depuis l’app de commande vocale, comme régler une alarme ou encore consulter des résultats de recherche sur un navigateur. Le clavier Google, qui se superpose sur d’autres apps est aussi une solution. Mais vous ne pouvez que rarement dicter l’ensemble des commandes désirées depuis l’app que vous utilisez ; vous êtes cantonné à l’utilisation tactile.

C’est là qu’intervient Nuance, une entreprise renommée mondialement pour ses services de reconnaissance vocale (elle est aussi derrière Swype, la technologie utilisée pour écrire en slidant sur un clavier). Dès les années 90, elle proposait déjà un service de dictée vocale pour les greffiers, toujours leader du marché actuel : Dragon. Ce que l’on sait moins… C’est que Nuance est derrière Google Now, S Voice (qui avait fait la renommée mondiale de Samsung avec le Galaxy S4), et peut-être même Siri.

Et Nuance a décidé de mettre ses technologies à profit : en les ouvrant aux développeurs, avec Nuance Mix, la firme souhaite s’affirmer dans le paysage de la reconnaissance vocale en permettant aux éditeurs d’intégrer un contrôle vocal complet dans leurs produits.

Le principe de Mix est simple : reconnaître du texte, le traduire par une action. Les développeurs n’auront qu’à indiquer au logiciel quelles commandes sont susceptibles d’utiliser leurs clients. Ensuite, Mix n’aura qu’à traduire l’information demandée en une action spécifique et l’indiquer à l’application.

Nuance Mix propose aux développeurs d’indiquer entre 15 et 20 manières différentes une même action à traduire : “mettre à jour mon statut”, “poster un statut”, “changer mon statut”, “je veux poster quelque chose”, “rédiger un post”, etc.

Une aubaine pour l’IoT

Le rapport aux objets connectés devient évident dès lors que l’on remarque que la miniaturisation des technologies étant de plus en plus présente, beaucoup d’objets connectés ne disposent pas d’écran tactile ou de boutons physiques, comme le remarque Ken Harper, chef de projet chez Nuance. Mais quid des autres ?

Là où ça devient très intéressant, c’est quand on imagine coupler Mix avec du hardware. La commande vocale pourrait être la source principale d’interaction avec nos objets connectés ! Moins d’effort pour une meilleure réactivité. Ne serait-ce pas une aubaine pour définir votre thermostat avant d’arriver chez vous par exemple ? Ce serait plus compliqué avec seulement des commandes physiques !

La vision d’Harper va même plus loin : si vous êtes dans la même pièce, pourquoi ne pas s’adresser directement à votre thermostat ? C’est beaucoup plus simple, plus rapide ! Et puis je rajouterai que s’affranchir de son smartphone dans son utilisation de la domotique et des objets connectés est une bonne chose, quand on connaît les coûts d’un Go de ROM/RAM aujourd’hui.

Le monopole pour Nuance ?

Avec Mix, Nuance se lance sur une idée innovante d’un marché en plein essor… Les géants de Mountain View, Cupertino et Redmond se mettront-ils à la page ? S’ils ne s’avancent pas maintenant, ils risquent fort d’être vite dépassés car l’engouement pour un tel produit sera immédiat et planétaire.

La bêta de Mix a été lancée le 15 décembre. Les développeurs pourront l’explorer mais devront attendre un peu avant de pouvoir en profiter ; Nuance précise que la solution sera payante, mais que les prix varieront (sûrement en fonction du client ; une bonne chose pour les petits développeurs) lors de la sortie officielle.