Saltar al contenido principal
Google

Google y tecnología de reconocimiento de voz

por 24 de julio de 2020No hay comentarios

Como la mayoría de las veces durante mi proceso de escritura, lo primero es abrir una nueva hoja de documentos de Google, en la que creo un borrador para el próximo tema interesante para alimentar en el blog. Entonces, elijo entre las tecnologías con el mismo cuidado de las cartas que les presento y Google parece hacer lo mismo.

Alfabeto de Google

Al momento de escribir, el anuncio de Google sobre Alphabet todavía se actualiza desde la semana pasada. Si ha pasado el radar de alguien, Alphabet es el movimiento de Google hacia la independencia para las compañías más "distantes" que anteriormente volaban bajo las alas de Google. Según Larry Page, CEO de Alphabet, la nueva estructura tiene como objetivo hacer que la empresa sea más limpia, más responsable y racionalizada. Alphabet es la compañía matriz que albergará una colección de compañías que van desde Boston Dynamics hasta DeepMind (que componen las letras B y D del alfabeto), pero lo que me llamó la atención fue la tecnología detrás de la letra O.

Está bien Google

Habilitado a través de la tecnología de reconocimiento de voz, Ok Google es búsqueda por voz y acciones para reactivar su web o aplicaciones móviles. Administre su calendario, navegación, entretenimiento y más a través de la voz, permitiendo que Google descifre Ok. Simplemente ve "Ok, Google ...".

"Por ejemplo, diga" Ok Google, necesito un paraguas mañana "para ver si hay lluvia en el pronóstico del tiempo".

Podemos esperar que Ok Google comience a trabajar sin conexión muy pronto, según un informe policial de Android. Aparentemente, el nuevo código en la aplicación claramente se refiere a la posibilidad de acciones a través de comandos de voz sin conexión a Internet. Sin embargo, el número de cadenas está muy limitado a acciones como reproducir música o enviar mensajes de texto.

Comandos de Google

De Audrey a Siri ... Y Barbie
La tecnología de reconocimiento de voz ha existido durante algunas décadas, pero no envejece en absoluto. Nacido en la década de 1950 con sistemas como Audrey, el reconocimiento de voz "despegó" en la década de 1970, pero el progreso aún ha sido bastante ... lento (¿ha entendido el sistema?). Sin embargo, en los últimos dos años, las cosas han comenzado a moverse.

“Primera pregunta hecha a la IA; "¿Hay un dios?" IA primera respuesta; "Hay ahora". "

@Elon Musk
La tecnología de reconocimiento de voz de Google ahora solo tiene una tasa de error 8% (en comparación con 23% en 2013). "En pocas palabras, el reconocimiento de voz en las máquinas ... cambiará por completo la forma en que los humanos interactúan con sus dispositivos informáticos", escribe Tim Tuttle, CEO de Expect Labs. Debido al profundo discurso y al círculo virtuoso de la IA, el reconocimiento de voz se está volviendo "extrañamente bueno", con un progreso de 18 meses que es más agresivo que lo que hemos visto en los últimos 15 años juntos. Según Tuttle, las computadoras comenzarán a escucharnos 24/7, y las interfaces de voz inteligentes pronto cambiarán a todo tipo de aplicaciones.

"El ciclo virtuoso de la inteligencia artificial: cuanto más se usa, mejor funciona, ya que recopila más datos y entran más usuarios"

@tim_tuttle
El mercado está probando esta tecnología recientemente mejorada en todas las formas posibles. Saluda a la inteligente Barbie, una muñeca con reconocimiento de voz que puede conversar con los usuarios, por ejemplo, los niños que juegan con ella. Es comprensible que esta primera muñeca interactiva haya generado preocupaciones sobre la privacidad sobre el hecho de que las grabaciones personales de las conversaciones de los niños con la muñeca se envían a compañías de terceros. "La falta de comprensión por parte de los usuarios y la participación de los niños, que son potencialmente incapaces de entender que sus acciones están siendo monitoreadas", es un problema que debe abordarse antes de que esta muñeca Barbie vuelva a casa.

¿Palabras picantes para esconder?

Una de las estadísticas populares que prospera en Internet ahora es que el 83% de los millennials duerme en sus teléfonos. Esta es una forma divertida de decir que las personas hoy en día, y en particular las generaciones más jóvenes, llevan constantemente sus dispositivos queridos con ellos. Esto subraya el fenómeno de intercepción apocalíptica, que se está moviendo de la pantalla de Hollywood a las mentes de los usuarios reales. ¿Tendrán acceso los sistemas divinos a todo lo que digo y luego darán palabras a sus predicadores, empresas?

Ok Google está tratando de solucionar el problema de privacidad simplemente usando "Ok Google" como palabra clave. Solo entonces se activará la tecnología y el dispositivo comenzará a escuchar lo que dice el usuario. Pero es cuestionable si una palabra clave es lo suficientemente segura.

S por seguridad

Me sorprende el gran potencial que ofrece la voz en las máquinas: desde obtener el pronóstico del tiempo sin problemas y llamar a personas de todo el mundo a bajo costo hasta conversaciones auténticas con robots. Pero para que la voz alcance verdaderamente un futuro inteligente, debe acercarse simultáneamente a un futuro seguro.

Hoy, llevar constantemente un oído digital con usted crea la sensación de ser monitoreado en lugar de monitorear la tecnología. En términos del alfabeto, esto me hace pensar que Google debería haber asignado la S a la seguridad.

Dejar una respuesta