Nome utente
google

Google e la tecnologia di riconoscimento vocale

per 24 Luglio 2020Non ci sono commenti

Come la maggior parte delle volte durante il mio processo di scrittura, la prima cosa è l’apertura di un nuovo foglio di documenti Google, in cui creo una bozza per il prossimo argomento interessante da alimentare nel blog. Quindi, scelgo tra le tecnologie con la stessa cura delle lettere che le sto presentando e Google sembra fare lo stesso.

Alfabeto di Google

Durante la scrittura, l’annuncio di Google su Alphabet è ancora aggiornato dalla scorsa settimana. Se ha superato il radar di qualcuno, Alphabet è la mossa di Google verso l’indipendenza per le aziende più “lontane” che precedentemente volavano sotto le ali di Google. Secondo Larry Page, CEO di Alphabet, la nuova struttura intende rendere l’azienda più pulita, più responsabile e snellita. Alphabet è la casa madre che ospiterà una collezione di aziende che vanno da Boston Dynamics a DeepMind (che costituisce la B e la D dell’alfabeto), ma ciò che ha attirato la mia attenzione è stata la tecnologia alla base della lettera O.

Ok Google

Abilitato tramite la tecnologia di riconoscimento vocale, Ok Google è la ricerca vocale e le azioni per riattivare le tue app Web o mobili. Gestisci il calendario, la navigazione, l’intrattenimento e altro ancora tramite la voce, lasciando decifrare Ok Google. Vai semplicemente “Ok, Google …”.

“Ad esempio, dì” Ok Google, ho bisogno di un ombrello domani “per vedere se c’è pioggia nelle previsioni del tempo.”

Possiamo aspettarci che Ok Google inizi a lavorare in modalità offline molto presto, secondo un rapporto della polizia Android. Apparentemente, il nuovo codice nell’app si riferisce chiaramente alla possibilità di azioni tramite comandi vocali senza una connessione a Internet. Tuttavia, il numero di stringhe è molto limitato ad azioni come la riproduzione di musica o l’invio di testi.

Comandi di Google

Da Audrey a Siri … E Barbie
La tecnologia di riconoscimento vocale esiste ormai da alcuni decenni, ma non invecchia affatto. Nato negli anni ’50 con sistemi come Audrey, il riconoscimento vocale “è decollato” negli anni ’70, ma i progressi sono stati ancora p-r-e-t-t-y … s-l-o-w (il sistema ha capito?). Negli ultimi due anni, tuttavia, le cose hanno iniziato a muoversi.

“Prima domanda posta all’IA; “C’è un dio?” Prima risposta AI; “C’è adesso.” ”

@Elon Musk
La tecnologia di riconoscimento vocale di Google ora ha solo un tasso di errore dell’8% (rispetto al 23% nel 2013). “In parole povere, il riconoscimento vocale nelle macchine … cambierà completamente il modo in cui gli umani interagiscono con i loro dispositivi informatici”, scrive Tim Tuttle, Amministratore delegato di Expect Labs. A causa del discorso profondo e del circolo virtuoso dell’IA, il riconoscimento vocale sta diventando “stranamente buono”, con un progresso di 18 mesi che è più aggressivo di quello che abbiamo visto negli ultimi 15 anni messi insieme. Secondo Tuttle, i computer inizieranno ad ascoltarci 24 ore su 24, 7 giorni su 7 e le interfacce vocali intelligenti passeranno presto a tutti i tipi di app.

“Il ciclo virtuoso dell’intelligenza artificiale – più viene utilizzato, meglio funziona man mano che raccoglie più dati e più utenti entrano”

@tim_tuttle
Il mercato sta provando questa tecnologia recentemente migliorata in tutti i modi possibili. Saluta la smart Barbie, una bambola dotata di riconoscimento vocale in grado di conversare con gli utenti, ad esempio i bambini che ci giocano. Questa primissima bambola interattiva ha comprensibilmente sollevato preoccupazioni sulla privacy riguardo al fatto che le registrazioni personali delle conversazioni dei bambini con la bambola vengono inviate a società terze. “La mancanza di comprensione da parte degli utenti e il coinvolgimento dei bambini, che sono potenzialmente incapaci di capire che le loro azioni vengono monitorate”, è un problema che deve essere affrontato prima che questa bambola Barbie si rompa casa.

Parole piccanti da nascondere?

Una delle statistiche popolari che prosperano su Internet ora è che l’83% dei millennial dorme con il proprio telefono. Questo è un modo divertente di dire che le persone al giorno d’oggi, e in particolare le generazioni più giovani, portano costantemente con sé i loro amati dispositivi. Ciò sottolinea il fenomeno apocalittico di intercettazione, che si sta spostando dallo schermo di Hollywood alle menti degli utenti reali. I sistemi simili a Dio avranno accesso a tutto ciò che dico e quindi daranno le parole ai loro predicatori, alle aziende?

Ok Google sta cercando di aggirare il problema della privacy semplicemente usando “Ok Google” come hotword. Solo allora la tecnologia verrà attivata e il dispositivo inizierà ad ascoltare ciò che l’utente sta dicendo. Ma è discutibile se una hotword sia abbastanza sicura.

S per sicurezza

Sono sorpreso dal grande potenziale offerto dalla voce nelle macchine: dall’ottenere le previsioni del tempo senza problemi e chiamare in modo economico alle persone di tutto il mondo, fino alle conversazioni autentiche con i robot. Ma affinché la voce raggiunga davvero un futuro intelligente, deve contemporaneamente avvicinarsi a un futuro sicuro.

Oggi, portare costantemente con sé un orecchio digitale crea la sensazione di essere monitorati piuttosto che monitorare la tecnologia. In termini di alfabeto, questo mi fa pensare che Google avrebbe dovuto assegnare la S alla sicurezza.

Lascia un commento