Zum Hauptinhalt springen
Google

Google und Spracherkennungstechnologie

durch 24. Juli 2020Keine Kommentare

Wie die meiste Zeit während meines Schreibprozesses ist das erste, was ich tun muss, ein neues Google Docs-Blatt zu öffnen, wo ich einen Entwurf für das nächste interessante Thema erstelle, um es in den Blog einzuspeisen. Also wähle ich unter den Technologien mit der gleichen Sorgfalt aus wie die Briefe, die ich ihnen präsentiere, und Google scheint dasselbe zu tun.

Google-Alphabet

Zum jetzigen Zeitpunkt ist die Ankündigung von Google zu Alphabet noch aktuell von letzter Woche. Wenn es an irgendjemandes Radar vorbeigegangen ist, ist Alphabet Googles Schritt in Richtung Unabhängigkeit für die „entfernteren“ Unternehmen, die zuvor unter Googles Flügeln geflogen sind. Laut Larry Page, CEO von Alphabet, soll die neue Einrichtung das Unternehmen sauberer, verantwortungsvoller und rationalisierter machen. Alphabet ist die Muttergesellschaft, die eine Reihe von Unternehmen beherbergen wird, die von Boston Dynamics bis DeepMind reichen (die das B und D des Alphabets bilden), aber was meine Aufmerksamkeit erregte, war die Technologie hinter dem Buchstaben O.

OK Google

Ok Google wird über die Spracherkennungstechnologie aktiviert und bietet Sprachsuche und Aktionen zum Aufwecken Ihrer Web- oder mobilen Apps. Verwalten Sie Ihren Kalender, Surfen, Unterhaltung und mehr per Sprache und lassen Sie Ok Google entschlüsseln. Gehen Sie einfach auf „Ok, Google…“.

„Sagen Sie zum Beispiel: „Ok Google, ich brauche morgen einen Regenschirm“, um zu sehen, ob es in der Wettervorhersage Regen gibt.“

Laut einem Android-Polizeibericht können wir davon ausgehen, dass Ok Google sehr bald im Offline-Modus arbeiten wird. Offenbar bezieht sich der neue Code in der App eindeutig auf die Möglichkeit von Aktionen per Sprachbefehl ohne Internetverbindung. Allerdings ist die Anzahl der Saiten auf Aktionen wie das Abspielen von Musik oder das Versenden von Liedtexten sehr begrenzt.

Google-Befehle

Von Audrey bis Siri … und Barbie
Die Spracherkennungstechnologie gibt es schon seit einigen Jahrzehnten, aber sie altert überhaupt nicht. In den 1950er Jahren mit Systemen wie Audrey geboren, begann die Spracherkennung in den 1970er Jahren, aber der Fortschritt war immer noch ziemlich … langsam (hat das System verstanden?). In den letzten Jahren hat sich jedoch etwas bewegt.

„Erste Frage an die KI; "Gibt es einen Gott?" AI erste Antwort; "Es gibt jetzt." "

@ Elon Musk
Die Spracherkennungstechnologie von Google hat nur noch eine Fehlerrate von 8% (im Vergleich zu 23% im Jahr 2013). „Einfach gesagt, Spracherkennung in Maschinen … wird die Art und Weise, wie Menschen mit ihren Computergeräten interagieren, völlig verändern“, schreibt Tim Tuttle, CEO von Expect Labs. Aufgrund der tiefen Sprache und des positiven Kreislaufs der KI wird die Spracherkennung „seltsam gut“, wobei ein Fortschritt von 18 Monaten aggressiver ist als das, was wir in den letzten 15 Jahren zusammen gesehen haben. Laut Tuttle werden Computer anfangen, uns rund um die Uhr zuzuhören, und intelligente Sprachschnittstellen werden bald auf alle Arten von Apps umstellen.

“Il ciclo virtuoso dell’künstliche Intelligenz – più viene utilizzato, meglio funziona man mano che raccoglie più dati e più utenti entrano”

@tim_tuttle
Der Markt testet diese neu verbesserte Technologie auf alle möglichen Arten. Begrüßen Sie die intelligente Barbie, eine Puppe mit Spracherkennung, die sich mit Benutzern unterhalten kann, z. B. mit spielenden Kindern. Diese allererste interaktive Puppe hat verständlicherweise Datenschutzbedenken aufgeworfen, da persönliche Aufzeichnungen von Gesprächen der Kinder mit der Puppe an Drittunternehmen gesendet werden. „Mangelndes Verständnis seitens der Benutzer und Beteiligung von Kindern, die möglicherweise nicht verstehen können, dass ihre Handlungen überwacht werden“, ist ein Problem, das angegangen werden muss, bevor diese Barbie-Puppe das Haus verlässt.

Scharfe Worte zum Verstecken?

Eine der beliebtesten Statistiken, die derzeit im Internet gedeihen, ist, dass der 83% der Millennials mit ihrem Telefon schläft. Dies ist eine lustige Art zu sagen, dass die Menschen heutzutage und insbesondere die jüngere Generation ihre geliebten Geräte ständig bei sich tragen. Dies unterstreicht das apokalyptische Abhörphänomen, das von der Hollywood-Leinwand in die Köpfe echter Benutzer übergeht. Werden gottähnliche Systeme Zugang zu allem haben, was ich sage, und dann die Worte an ihre Prediger, Unternehmen weitergeben?

Ok Google versucht, das Datenschutzproblem zu umgehen, indem es einfach „Ok Google“ als Hotword verwendet. Erst dann wird die Technologie aktiviert und das Gerät beginnt zuzuhören, was der Benutzer sagt. Es ist aber fraglich, ob ein Hotword sicher genug ist.

S für Sicherheit

Ich bin erstaunt über das große Potenzial, das Voice in Machines bietet: vom reibungslosen Abrufen von Wettervorhersagen über das kostengünstige Telefonieren mit Menschen auf der ganzen Welt bis hin zu authentischen Gesprächen mit Robotern. Aber damit Sprache wirklich eine intelligente Zukunft erreichen kann, muss sie gleichzeitig einer sicheren Zukunft näher kommen.

Heutzutage erzeugt das ständige Tragen eines digitalen Ohrs eher das Gefühl, überwacht zu werden als die Technologie zu überwachen. In Bezug auf das Alphabet denke ich, dass Google das S der Sicherheit hätte zuweisen sollen.

Hinterlasse eine Antwort