Passer au contenu principal
Google

Google et la technologie de reconnaissance vocale

Par 24 juillet 2020Sans commentaires

Comme la plupart du temps au cours de mon processus d'écriture, la première chose à faire est d'ouvrir une nouvelle feuille Google Docs, dans laquelle je crée un aperçu du prochain sujet intéressant à alimenter sur le blog. Je choisis donc entre les technologies avec autant de soin que les lettres que je leur présente, et Google semble faire de même.

Alphabet Google

Au moment de la rédaction de cet article, l'annonce de Google concernant Alphabet est toujours d'actualité par rapport à la semaine dernière. S'il a échappé aux radars, Alphabet représente le pas de Google vers l'indépendance des entreprises les plus « lointaines » qui volaient auparavant sous les ailes de Google. Selon Larry Page, PDG d'Alphabet, la nouvelle structure vise à rendre l'entreprise plus propre, plus responsable et rationalisée. Alphabet est la société mère qui hébergera un ensemble d'entreprises allant de Boston Dynamics à DeepMind (qui constitue le B et le D de l'alphabet), mais ce qui a retenu mon attention, c'est la technologie derrière la lettre O.

OK Google

Activé grâce à la technologie de reconnaissance vocale, Ok Google propose une recherche vocale et des actions pour réactiver vos applications Web ou mobiles. Gérez votre calendrier, votre navigation, vos divertissements et bien plus encore vocalement, en laissant Ok Google le déchiffrer. Allez simplement « Ok, Google… ».

"Par exemple, dites "Ok Google, j'ai besoin d'un parapluie demain" pour voir s'il y a de la pluie dans les prévisions météo."

On peut s'attendre à ce qu'Ok Google commence très prochainement à travailler en mode hors ligne, selon un rapport de la police Android. Apparemment, le nouveau code de l'application fait clairement référence à la possibilité d'actions via des commandes vocales sans connexion Internet. Cependant, le nombre de chaînes est très limité à des actions comme jouer de la musique ou envoyer des SMS.

Commandes Google

D'Audrey à Siri… Et Barbie
La technologie de reconnaissance vocale existe depuis quelques décennies maintenant, mais elle ne vieillit pas du tout. Née dans les années 1950 avec des systèmes comme Audrey, la reconnaissance vocale a « décollé » dans les années 1970, mais les progrès étaient encore assez… lents (le système a-t-il compris ?). Mais depuis quelques années, les choses ont commencé à bouger.

« Première question posée à l’IA ; "Y a-t-il un dieu?" Première réponse de l'IA ; "Il y a maintenant." »

@Elon Musk
La technologie de reconnaissance vocale de Google n'a désormais qu'un taux d'erreur de 8% (contre 23% en 2013). « En termes simples, la reconnaissance vocale dans les machines… va complètement changer la façon dont les humains interagissent avec leurs appareils informatiques », écrit Tim Tuttle, PDG d'Expect Labs. En raison de la parole profonde et du cycle vertueux de l'IA, la reconnaissance vocale devient « incroyablement bonne », avec des progrès sur 18 mois plus agressifs que ceux que nous avons vus au cours des 15 dernières années combinées. Selon Tuttle, les ordinateurs commenceront à nous écouter 24 heures sur 24, 7 jours sur 7, et les interfaces vocales intelligentes seront bientôt transférées vers toutes sortes d'applications.

“Il ciclo virtuoso dell’intelligence artificielle – più viene utilizzato, meglio funziona man mano che raccoglie più dati e più utenti entrano”

@tim_tuttle
Le marché essaie cette technologie nouvellement améliorée de toutes les manières possibles. Dites bonjour à la Barbie intelligente, une poupée à reconnaissance vocale qui peut converser avec les utilisateurs, comme les enfants qui jouent avec. Cette toute première poupée interactive a naturellement soulevé des problèmes de confidentialité concernant les enregistrements personnels des conversations des enfants avec la poupée envoyés à des sociétés tierces. "Le manque de compréhension des utilisateurs et l'implication des enfants, qui sont potentiellement incapables de comprendre que leurs actions sont surveillées", est un problème qui doit être résolu avant que cette poupée Barbie ne détruise la maison.

Des mots épicés à cacher ?

L’une des statistiques les plus populaires sur Internet actuellement est que les millennials 83% dorment avec leur téléphone. C’est une façon amusante de dire que les gens d’aujourd’hui, et en particulier les jeunes générations, emportent constamment avec eux leurs appareils bien-aimés. Cela met en évidence le phénomène apocalyptique des écoutes clandestines, qui passe des écrans hollywoodiens à l’esprit des vrais utilisateurs. Les systèmes semblables à Dieu auront-ils accès à tout ce que je dis et donneront-ils ensuite ces paroles à leurs prédicateurs, aux entreprises ?

Ok, Google essaie de contourner le problème de confidentialité en utilisant simplement « Ok Google » comme mot clé. Ce n’est qu’alors que la technologie sera activée et que l’appareil commencera à écouter ce que dit l’utilisateur. Mais on peut se demander si un mot clé est suffisamment sûr.

Oui pour la sécurité

Je suis étonné par le grand potentiel qu'offre la voix dans les machines : depuis l'obtention transparente de prévisions météorologiques et l'appel rentable à des personnes partout dans le monde, jusqu'aux conversations authentiques avec des robots. Mais pour que la voix puisse véritablement atteindre un avenir intelligent, elle doit simultanément s’approcher d’un avenir sûr.

Aujourd’hui, avoir constamment une oreille numérique sur soi crée le sentiment d’être surveillé plutôt que de surveiller la technologie. En termes d’alphabet, cela me fait penser que Google aurait dû attribuer le S pour des raisons de sécurité.

Laisser un commentaire