Como en la mayoría de las sesiones de escritura, lo primero que hago es abrir un nuevo Documento de Google, donde creo un borrador del próximo tema interesante sobre el que escribiré en el blog. Luego, elijo las tecnologías que utilizo con el mismo cuidado que las cartas que envío, y Google parece hacer lo mismo.
Alfabeto de Google
Mientras escribo esto, el anuncio de Google sobre Alphabet aún está reciente, de la semana pasada. Si a alguien se le ha pasado por alto, Alphabet representa el paso de Google hacia la independencia de las empresas más distantes que antes operaban bajo su tutela. Según Larry Page, director ejecutivo de Alphabet, la nueva estructura busca hacer que la empresa sea más transparente, responsable y eficiente. Alphabet es la empresa matriz que albergará un conjunto de empresas que van desde Boston Dynamics hasta DeepMind (que conforman la B y la D del alfabeto), pero lo que me llamó la atención fue la tecnología detrás de la letra O.
Está bien Google
Gracias a la tecnología de reconocimiento de voz, Ok Google te permite buscar por voz y activar tus apps web o móviles. Gestiona tu calendario, navegación, entretenimiento y mucho más con tu voz, dejando que Ok Google lo descifre. Simplemente di: "Ok, Google..."
“Por ejemplo, di ‘Ok Google, necesito un paraguas mañana’ para ver si hay lluvia en el pronóstico del tiempo”.
Según un informe de Android Police, podemos esperar que Ok Google empiece a funcionar sin conexión muy pronto. Al parecer, el nuevo código de la app se refiere claramente a la posibilidad de usar comandos de voz sin conexión a internet. Sin embargo, el número de cadenas está muy limitado a acciones como reproducir música o enviar mensajes de texto.
Comandos de Google
De Audrey a Siri ... Y Barbie
La tecnología de reconocimiento de voz existe desde hace algunas décadas, pero no parece estar envejeciendo. Nacida en la década de 1950 con sistemas como Audrey, el reconocimiento de voz despegó con fuerza en la década de 1970, pero el progreso seguía siendo bastante lento (¿lo entiende el sistema?). Sin embargo, en los últimos dos años, las cosas han empezado a cambiar.
Primera pregunta a la IA: "¿Existe un dios?". Primera respuesta de la IA: "Ahora sí lo hay".
@Elon Musk
La tecnología de reconocimiento de voz de Google ahora tiene una tasa de error de tan solo 81 TP3T (en comparación con los 231 TP3T de 2013). «En pocas palabras, el reconocimiento de voz automático... cambiará por completo la forma en que los humanos interactúan con sus dispositivos informáticos», escribe Tim Tuttle, director ejecutivo de Expect Labs. Gracias al habla profunda y al círculo virtuoso de la IA, el reconocimiento de voz se está volviendo increíblemente eficaz, con un progreso en los últimos 18 meses más agresivo que el de los últimos 15 años juntos. Según Tuttle, las computadoras comenzarán a escucharnos las 24 horas del día, los 7 días de la semana, y pronto habrá interfaces de voz inteligentes en todo tipo de aplicaciones.
“El círculo virtuoso de la inteligencia artificial: cuanto más se utiliza, mejor funciona, ya que recopila más datos y se unen más usuarios”.
@tim_tuttle
El mercado está probando esta tecnología mejorada de todas las maneras posibles. Bienvenidos a la Barbie inteligente, una muñeca con reconocimiento de voz que puede conversar con usuarios, como los niños que juegan con ella. Es comprensible que esta primera muñeca interactiva haya suscitado inquietudes sobre la privacidad, ya que las grabaciones personales de las conversaciones de los niños con ella se envían a empresas externas. «La falta de comprensión y participación de los niños por parte de los usuarios, quienes potencialmente no pueden entender que sus acciones están siendo monitoreadas», es un problema que debe abordarse antes de que esta muñeca Barbie se haga popular.
¿Palabras picantes para esconder?
Una de las estadísticas más populares en internet últimamente es que los millennials duermen con sus teléfonos. Es una forma curiosa de decir que la gente hoy en día, especialmente las generaciones más jóvenes, lleva consigo constantemente sus preciados dispositivos. Esto subraya el fenómeno apocalíptico de las escuchas telefónicas, que está pasando de las pantallas de Hollywood a las mentes de los usuarios reales. ¿Tendrán acceso los sistemas divinos a todo lo que digo y, por lo tanto, cederán sus palabras a sus predicadores y corporaciones?
Ok Google intenta evitar el problema de privacidad simplemente usando "Ok Google" como palabra clave. Solo entonces se activará la tecnología y el dispositivo comenzará a escuchar lo que dice el usuario. Sin embargo, es cuestionable si una palabra clave es lo suficientemente segura.
S por seguridad
Me asombra el enorme potencial que ofrece la voz en las máquinas: desde pronósticos meteorológicos precisos y llamadas rentables a personas de todo el mundo, hasta conversaciones auténticas con robots. Pero para que la voz logre un futuro inteligente, también debe acercarse a un futuro seguro.
Hoy en día, llevar constantemente un auricular digital crea la sensación de estar siendo monitoreado, en lugar de monitorear la tecnología. En términos alfabéticos, esto me hace pensar que Google debería haber asignado la S de seguridad.