Ir para o conteúdo principal
Google

Google e tecnologia de reconhecimento de fala

por 24 de julho de 2020Sem comentarios

Como na maioria das vezes durante meu processo de escrita, a primeira coisa é abrir uma nova planilha do Google Docs, onde crio um rascunho para o próximo tópico interessante para alimentar o blog. Então, escolho entre as tecnologias com o mesmo cuidado que as cartas que estou apresentando a eles, e o Google parece fazer o mesmo.

alfabeto do Google

Até o momento, o anúncio do Google no Alphabet ainda está atualizado na semana passada. Se passou no radar de alguém, Alphabet é o movimento do Google em direção à independência para as empresas mais "distantes" que anteriormente voavam sob as asas do Google. De acordo com Larry Page, CEO da Alphabet, a nova instalação pretende tornar a empresa mais limpa, responsável e ágil. A Alphabet é a controladora que vai abrigar uma coleção de empresas que vão desde Boston Dynamics até DeepMind (que compõe o B e D do alfabeto), mas o que me chamou a atenção foi a tecnologia por trás da letra O.

Ok google

Ativado por meio da tecnologia de reconhecimento de voz, o Ok Google é uma pesquisa por voz e ações para ativar seus aplicativos da Web ou móveis. Gerencie seu calendário, navegação, entretenimento e muito mais por voz, permitindo que o Ok Google descriptografe. Basta ir “Ok, Google…”.

"Por exemplo, digamos" Ok Google, preciso de um guarda-chuva amanhã "para ver se há chuva na previsão do tempo."

Podemos esperar que o Ok Google comece a trabalhar no modo offline muito em breve, de acordo com um relatório da polícia do Android. Ao que tudo indica, o novo código do app refere-se claramente à possibilidade de ações por meio de comandos de voz sem conexão com a internet. No entanto, o número de cordas é muito limitado a ações como tocar música ou enviar letras.

Comandos do Google

De Audrey a Siri… e Barbie
A tecnologia de reconhecimento de fala já existe há algumas décadas, mas não envelhece. Nascido na década de 1950 com sistemas como o Audrey, o reconhecimento de fala "decolou" na década de 1970, mas o progresso ainda era muito… lento (o sistema entendeu?). Nos últimos dois anos, no entanto, as coisas começaram a se mover.

“Primeira pergunta feita à IA; "Existe um deus?" AI primeira resposta; "Existe agora." "

@Elon Musk
A tecnologia de reconhecimento de fala do Google agora tem apenas uma taxa de erro de 8% (em comparação com 23% em 2013). "Simplificando, o reconhecimento de fala em máquinas... mudará completamente a maneira como os humanos interagem com seus dispositivos de computação", escreve Tim Tuttle, CEO da Expect Labs. Devido à fala profunda e ao círculo virtuoso da IA, o reconhecimento de fala está se tornando "estranhamente bom", com um avanço de 18 meses sendo mais agressivo do que vimos nos últimos 15 anos combinados. De acordo com Tuttle, os computadores começarão a nos ouvir 24 horas por dia, 7 dias por semana, e as interfaces de voz inteligentes em breve mudarão para todos os tipos de aplicativos.

"O ciclo virtuoso da inteligência artificial - quanto mais é usado, melhor funciona, pois coleta mais dados e mais usuários entram"

@tim_tuttle
O mercado está experimentando essa tecnologia recentemente aprimorada de todas as maneiras possíveis. Diga olá à Barbie inteligente, uma boneca com reconhecimento de voz que pode conversar com usuários, como crianças brincando com ela. Esta primeira boneca interativa levantou, compreensivelmente, preocupações com a privacidade de que gravações pessoais de conversas de crianças com a boneca estão sendo enviadas para empresas terceirizadas. “A falta de compreensão dos usuários e o envolvimento das crianças, que são potencialmente incapazes de entender que suas ações estão sendo monitoradas”, é um problema que precisa ser resolvido antes que essa boneca Barbie invada a casa.

Palavras picantes para esconder?

Uma das estatísticas populares que prosperam na internet agora é que o 83% dos millennials dorme com o telefone. Esta é uma maneira divertida de dizer que as pessoas hoje em dia, e especialmente a geração mais jovem, carregam constantemente seus amados dispositivos com eles. Isso ressalta o fenômeno apocalíptico de escutas telefônicas, que está se movendo da tela de Hollywood para as mentes dos usuários reais. Os sistemas semelhantes a Deus terão acesso a tudo o que eu digo e depois darão as palavras aos seus pregadores, empresas?

Ok, o Google está tentando contornar o problema de privacidade simplesmente usando “Ok Google” como hotword. Só então a tecnologia será ativada e o aparelho começará a ouvir o que o usuário está dizendo. Mas é questionável se uma hotword é segura o suficiente.

S para segurança

Estou impressionado com o grande potencial oferecido pela voz nas máquinas: desde obter previsões meteorológicas sem problemas e fazer chamadas baratas para pessoas ao redor do mundo, até conversas autênticas com robôs. Mas para que a voz alcance verdadeiramente um futuro inteligente, ela deve, simultaneamente, aproximar-se de um futuro seguro.

Hoje, carregar constantemente um ouvido digital com você cria a sensação de estar sendo monitorado em vez de monitorar a tecnologia. Em termos de alfabeto, isso me faz pensar que o Google deveria ter atribuído o S à segurança.

Deixe uma resposta