Un clavier? Comme c'est pittoresque

L'ère de la recherche vocale et des logiciels à commande vocale est à nos portes. En tant que développeur, je vis et meurs par le clavier, mais je peux déjà voir les signes: comme beaucoup de gens, par exemple, je parle à mon téléphone Android (par exemple, "Naviguer vers Lowes [ou Starbucks ou Harris Teeter]") pour obtenir des directions.

Dans le rapport sur les tendances Internet 2016 de Mary Meeker, elle rapporte que les requêtes de recherche Google Voice ont été multipliées par sept depuis 2010. J'ai également remarqué que mon fils de 12 ans effectue presque toutes ses recherches vocales - et mon petite amie m'envoie des SMS de cette façon sur une base régulière. En outre, la société pour laquelle je travaille, Lucidworks, a récemment annoncé un nouveau partenariat avec IBM pour intégrer Watson et les fonctionnalités de synthèse vocale dans notre produit de recherche d'entreprise. 

La technologie fonctionne beaucoup mieux qu'auparavant et elle est plus facile à intégrer dans les applications. Si vous développez pour Android ou iOS, vous pouvez facilement vous connecter aux API pour la reconnaissance vocale. Mais la reconnaissance vocale ne commence ni ne se termine par de simples commandes vocales et vocales.

Comprendre l'intention de la recherche est une tâche très contextuelle, en particulier avec la langue parlée. De plus, les gens ont tendance à utiliser plus de mots dans la langue parlée naturelle que lorsqu'ils sont confrontés à une barre de recherche. Il y a plus de «mots parasites» dans la langue parlée que dans une recherche textuelle normale.

Ce sont des défis importants en matière d'IA. Mais à mesure que nous surmontons le problème de contexte, les développeurs apprendront qu'il est possible de faire plus avec la voix qu'avec le texte. Le contexte émotionnel jouera un rôle. Si vous cherchez une station-service, voulez-vous la moins chère ou la plus proche? Le contenu émotionnel de votre voix pourrait impliquer cela. Bien sûr, vous pourriez clarifier, mais vous pourriez ne pas avoir à le faire.

Votre avenir bavard

L'époque de la voix ne concerne pas uniquement la recherche. Cela affectera la façon dont nous interagissons avec les ordinateurs. Dans un avenir pas trop lointain, les claviers seront considérés comme «pittoresques», comme Scotty les a décrits dans «Star Trek IV».

Mais ce changement nécessite également une toute nouvelle interface utilisateur. Voici une ancienne illustration de ce que je veux dire: lorsque Windows 95 est sorti, IBM avait intégré des commandes vocales dans ses PC. À l'époque, je travaillais en tant que vendeur chez Office Depot, et il est rapidement devenu évident à quel point les commandes vocales étaient peu pratiques. L'interface fenêtrée ne se prêtait pas du tout à cette forme d'interaction.

Je veux dire, comment diable pouvez-vous déplacer une fenêtre hors du chemin d'une autre fenêtre et les redimensionner toutes les deux pour les adapter à l'écran de manière efficace avec des commandes vocales? Vous ne le faites pas. Vous abandonnez complètement ces fenêtres (et probablement Windows). Une interface utilisateur vocale n'utilise pas les mêmes motifs. Vous ne voyez jamais une interface fenêtrée sur "Star Trek".

En parlant de "Star Trek", quand les gens commencent à coder ou à faire quelque chose de technique, ils passent toujours à une interface tactile (OK, pas exactement tactile - cela ressemble plus à un clavier à micro-ondes recouvert de rendus art nouveau d'un circuit imprimé). Mais la régression au «typage» est-elle nécessaire? Certes, je ne peux pas imaginer utiliser une interface vocale pour coder dans Scala. Peut-être que de nouveaux langages (sans parenthèses, contrairement à Scala - et à mes articles) seront développés spécialement adaptés à la voix.

Les sites Web ne se ressembleront sûrement pas et proposeront de nouveaux paradigmes de navigation. Vous direz "montrez-moi des offres sur les chaussures", et ce que vous obtiendrez sera probablement mieux organisé et plus sensible au contexte que votre site Web moyen ("offres" && "chaussures"). De plus, je ne veux pas trop faire défiler ou dire "page suivante", donc les interactions devront être personnalisées. Le système devrait déjà savoir que je veux des chaussures pour hommes et que je ne veux pas de chaussures à talons durs à cause de ma tendinite d'Achille. Peut-être qu'il sait que je préfère les couleurs sombres. Peut-être que je l'ai dit ou peut-être qu'il a analysé mon comportement.

S'agit-il d'un site Web? Bien sûr, si je fais du shopping de chaussures, je veux une représentation visuelle, mais si je parle, peut-être que la machine répond. Peut-être qu'il me montre des chaussures, puis demande: "Cherchez-vous un type de chaussure en particulier? À quoi servent ces chaussures? Les portez-vous en randonnée ou à une fête?"

L'ère de la recherche vocale changera tout, de la façon dont nous interagissons avec les machines à la façon dont nous codons. Bon nombre des technologies dont nous avons besoin nous sont déjà disponibles aujourd'hui, tandis que d'autres doivent encore être inventées. L'effet sur les interfaces utilisateur pourrait être plus profond que le passage des cartes perforées aux claviers.

Ce changement radical ne viendra pas d'un seul coup. Aujourd'hui n'est pas le jour pour jeter votre clavier. Mais ce pourrait être le jour pour commencer à penser à la refonte de votre site Web pour qu'il soit vraiment accessible à la voix.