Rédigé par

Etienne Alcouffe

Voice UI (VUI), et les nouvelles opportunités qu’elle présente

mai 19, 2018

Alexa, Siri et Bixby sont des assistants pratiques pour les tâches quotidiennes. Toutefois, la technologie vocale qui avance rapidement peut faire obstacle.

 

Voice UI (VUI) est soudainement partout quoique de nombreux défis soient à surmonter avec la technologie encore en développement. Bien que la voix ne soit ni une plateforme ni le paradigme de l’interface utilisateur de l’avenir. C’est une interface utilisateur supplémentaire qui est là pour rester.

 

Trouver les créneaux où il fonctionne le mieux, et jouer sur les forces de la voix sont les principaux défis à surmonter.

 

Une interface utilisateur dans la recherche d’une application

 

Des années de travail ont permis à Siri et à Google Assistant de répondre à vos questions et d’agir en tant que partenaire de conversation vous donnant accès à toutes les informations.

 

Malgré cela, nous les utilisons plutôt pour vérifier des banalités et peut-être poser une ou deux questions aléatoires pour Internet. Alexa est apparue et nous a donné une plus grande capacité à gérer l’expérience audio à la maison. Même si VUI est toujours une nouveauté pour la plupart des gens.

 

Certes, c’est un outil puissant, mais la plupart des utilisateurs ne savent pas ce qu’ils peuvent en faire, ni comment l’intégrer dans leur vie.

 

L’ancienne maxime de l’immobilier est que tout est une question d’emplacement. VUI partage ce principe comme quoi la façon dont vous interagissez avec les appareils par la voix est en grande partie conditionnée par votre position.

 

La conduite est devenue le plus intéressant pour VUI parce que ce domaine demande à ce que la voix excelle.

 

Dans la maison, être capable de contrôler sa musique tout faisant d’autres activités s’est également avéré populaire. Il en est de même pour la possibilité d’obtenir une réponse à une question sans devoir sortir son téléphone.

 

Cependant, d’autres endroits sont moins favorables à VUI. La bibliothèque, par exemple, fournit un bon avantage pour les interfaces graphiques ou le GUI, mais est un mauvais endroit pour toute communication vocale. Pareil pour une réunion d’affaires ou une conférence qui est un mauvais environnement pour VUI.

 

Là où VUI ne mesure toujours pas

 

 

VUI a parcouru un long chemin et continue de s’améliorer, mais elle est encore entravée par plusieurs difficultés.

 

Les problèmes d’exactitude continuent à empoisonner les principaux systèmes à commande vocale aux États-Unis. Le problème n’est pas tant la reconnaissance vocale.

 

En fait, même lorsque ces assistants obtiennent une entrée correcte, ils produisent souvent des rendements hilarants. Des questions simples comme «J’ai besoin d’un médecin» peuvent donner une liste de médecins à proximité ou une entrée de Wikipédia sur des médecins, tandis que des questions plus complexes échappent souvent à leur capacité de traitement et de compréhension.

 

Certes, si vous utilisez VUI pour poser des questions sur la météo, la réponse se produit presque instantanément. Cependant, l’information fournie prend souvent plus de temps à traiter qu’une réponse visuelle.

 

L’Assistant de Google affichera une carte météo à l’écran si vous posez des questions sur la météo. Le temps que Google prenne connaissance de l’endroit où vous êtes, des prévisions d’aujourd’hui et de la température actuelle. Vous pouvez lire et relire toutes les informations disponibles, en plus de vous faire une idée des prévisions de température pour les prochaines heures.

 

On se plaint de la tendance d’Alexa à fournir trop d’informations lorsqu’il lui est demandé de jouer une chanson. Elle ne commence pas simplement la chanson, mais vous dira aussi d’autres informations sur la chanson. Pour les chansons mettant en vedette plusieurs artistes, une introduction cauchemardesque peut surgir alors que vous vouliez juste écouter de la musique.

 

La lecture des listes est ennuyeuse

 

Les concepteurs parlent de la charge cognitive, qui est la quantité d’effort nécessaire pour traiter l’information fournie. Les utilisateurs qui interagissent avec une interface graphique ont tendance à demander une attention constante pour traiter l’information à l’écran.

 

VUI ne demande aucune attention lorsqu’il n’y a pas d’interface connectée. Toutefois, une grande attention est demandée lorsqu’il est question de requête et réponse.

 

Cela présente un problème lorsque vous utilisez VUI pour fournir des informations sous forme de liste. Demandez une recette rapide pour le poulet, et vous pourriez recevoir toute une liste.

 

Malheureusement, la liste peut contenir neuf entrées, et au moment où vous atteignez la fin. Vous avez oublié quelle était la troisième entrée.

 

En fait, arrivé au septième élément de la liste, votre attention maximale est susceptible d’être atteinte à tel point que vous commencez à vous diriger vers le GUI le plus proche en abandonnant VUI.

 

Présente l’avenir

 

Il existe des solutions aux difficultés rencontrées par les utilisateurs de VUI, et de nombreuses entreprises investissent beaucoup pour les trouver et améliorer l’expérience.

 

L’une des façons d’améliorer l’interaction vocale consiste à rendre l’expérience plus conversationnelle pour les utilisateurs.

 

L’intégration des réponses vocales et des données visuelles de manière transparente entre l’écran. Et le haut-parleur est essentielle pour surmonter les limitations de VUI, créant ainsi une interaction plus naturelle pour l’utilisateur.

 

Actuellement, la réponse vocale n’est que marginalement connectée à toute interaction visuelle avec des appareils comme Amazon Echo qui sont presque complètement coupés de tout écran.

 

Au fur et à mesure que l’Internet se développera. Il deviendra impératif de trouver un moyen de présenter les informations par la voix en même temps que par le visuel.

 

La technologie sera toujours sujette à l’erreur. Mais la gestion efficace des faux pas verbaux peut rendre les utilisateurs plus à l’aise dans l’interaction par la voix.

 

Cela signifie, fournir une meilleure réponse que «Je suis désolé. Je ne l’ai pas bien compris.», ou deviner aveuglément la réponse lorsqu’une requête n’est pas bien comprise.

 

Amélioration, pas un remplacement

 

Ceux qui tombent dans l’erreur de considérer les interfaces vocales comme étant un remplacement de l’interface graphique ne parviennent pas à apprendre de l’histoire.

 

Sur le Starship Enterprise, l’équipage du 23e siècle communique régulièrement avec l’ordinateur par la voix, tout en intégrant également l’interaction visuelle et tactile.

 

Il est vrai que nous avons dépassé ces méthodes. Mais cela nous donne une idée de la façon dont peut se présenter l’émergence d’une interaction informatique sans failles.

 

Nos plus grands défis ne sont pas tant de mettre la technologie à niveau mais d’imaginer de meilleures façons de l’utiliser. Lorsqu’il est bien utilisé, VUI fournit un autre outil pour interagir avec la technologie.