Como na maioria das sessões de escrita, a primeira coisa que faço é abrir um novo Documento Google, onde crio um rascunho do próximo tópico interessante para o blog. Em seguida, escolho as tecnologias que usarei com o mesmo cuidado com que escrevo as cartas, e o Google parece fazer o mesmo.
alfabeto do Google
Enquanto escrevo isto, o anúncio do Google sobre a Alphabet ainda é recente, da semana passada. Se alguém ainda não sabe, a Alphabet representa o movimento do Google rumo à independência para as empresas mais "distantes" que antes estavam sob a tutela do Google. De acordo com o CEO da Alphabet, Larry Page, a nova estrutura visa tornar a empresa mais limpa, responsável e ágil. A Alphabet é a empresa-mãe que abrigará um conjunto de empresas que vão da Boston Dynamics à DeepMind (que compõe o B e o D do alfabeto), mas o que me chamou a atenção foi a tecnologia por trás da letra O.
Ok google
Habilitado pela tecnologia de reconhecimento de voz, o Ok Google oferece ações de busca e ativação por voz para seus aplicativos web ou móveis. Gerencie seu calendário, navegação, entretenimento e muito mais com sua voz, deixando o Ok Google decifrar. Basta dizer "Ok, Google..."
“Por exemplo, diga ‘Ok Google, preciso de um guarda-chuva amanhã’ para ver se há chuva na previsão do tempo.”
Podemos esperar que o Ok Google comece a funcionar offline em breve, de acordo com um relatório do Android Police. Aparentemente, o novo código no aplicativo faz referência clara à possibilidade de comandos de voz sem conexão com a internet. No entanto, o número de sequências de caracteres é muito limitado para ações como tocar música ou enviar mensagens de texto.
Comandos do Google
De Audrey a Siri… e Barbie
A tecnologia de reconhecimento de voz já existe há algumas décadas, mas não parece estar envelhecendo. Nascida na década de 1950 com sistemas como o Audrey, a tecnologia de reconhecimento de voz realmente decolou na década de 1970, mas o progresso ainda era bastante lento (será que o sistema entende?). Nos últimos dois anos, porém, as coisas começaram a mudar.
“Primeira pergunta feita à IA: “Existe um deus?” Primeira resposta da IA: “Agora existe.”
@Elon Musk
A tecnologia de reconhecimento de fala do Google agora apresenta uma taxa de erro de apenas 81 TP3T (contra 231 TP3T em 2013). "Simplificando, o reconhecimento de fala por máquina... mudará completamente a maneira como os humanos interagem com seus dispositivos de computação", escreve Tim Tuttle, CEO da Expect Labs. Graças à fala profunda e ao ciclo virtuoso da IA, o reconhecimento de fala está se tornando "incrivelmente bom", com o progresso nos últimos 18 meses sendo mais agressivo do que o que vimos nos últimos 15 anos combinados. De acordo com Tuttle, os computadores começarão a nos ouvir 24 horas por dia, 7 dias por semana, e interfaces de voz inteligentes em breve estarão presentes em todos os tipos de aplicativos.
“O ciclo virtuoso da inteligência artificial: quanto mais usada, melhor funciona, pois coleta mais dados e mais usuários aderem.”
@tim_tuttle
O mercado está testando essa tecnologia recém-aprimorada de todas as maneiras possíveis. Diga olá à Barbie inteligente, uma boneca equipada com reconhecimento de voz que pode conversar com usuários, como crianças que brincam com ela. Esta primeira boneca interativa, compreensivelmente, levantou preocupações sobre privacidade, visto que gravações pessoais de conversas de crianças com a boneca estão sendo enviadas a empresas terceirizadas. "A falta de compreensão do usuário e o envolvimento das crianças, que são potencialmente incapazes de entender que suas ações estão sendo monitoradas", é um problema que precisa ser resolvido antes que esta boneca Barbie se torne pública.
Palavras picantes para esconder?
Uma das estatísticas populares que circulam na internet atualmente é que os millennials dormem com seus celulares. É uma maneira engraçada de dizer que as pessoas hoje em dia, especialmente as gerações mais jovens, carregam seus amados dispositivos constantemente consigo. Isso ressalta o fenômeno apocalíptico da espionagem, que está migrando das telas de Hollywood para as mentes dos usuários reais. Será que sistemas divinos terão acesso a tudo o que eu digo e, assim, entregarão as palavras aos seus pregadores e corporações?
O Google está tentando contornar a questão da privacidade simplesmente usando "Ok Google" como hotword. Só então a tecnologia será ativada e o dispositivo começará a ouvir o que o usuário está dizendo. Mas é questionável se uma hotword é segura o suficiente.
S para segurança
Estou impressionado com o enorme potencial que a voz oferece às máquinas: desde previsões meteorológicas precisas e ligações econômicas para pessoas ao redor do mundo, até conversas autênticas com robôs. Mas, para que a voz realmente alcance um futuro inteligente, ela também precisa se aproximar de um futuro seguro.
Hoje em dia, carregar constantemente um fone de ouvido digital cria a sensação de estar sendo monitorado, em vez de monitorar a tecnologia. Em termos alfabéticos, isso me faz pensar que o Google deveria ter atribuído o S de segurança.