Wie bei den meisten Schreibsitzungen öffne ich als Erstes ein neues Google-Dokument und erstelle darin einen Entwurf für das nächste interessante Thema, über das ich bloggen möchte. Die verwendeten Technologien wähle ich dann mit der gleichen Sorgfalt aus wie die Briefe, die ich einreiche, und Google scheint dasselbe zu tun.
Google-Alphabet
Während ich dies schreibe, ist Googles Ankündigung zu Alphabet noch frisch von letzter Woche. Falls es jemandem entgangen sein sollte: Alphabet ist Googles Schritt in die Unabhängigkeit der „entfernteren“ Unternehmen, die bisher unter Googles Fittichen flog. Laut Alphabet-CEO Larry Page soll die neue Struktur das Unternehmen sauberer, verantwortungsvoller und schlanker machen. Alphabet ist die Muttergesellschaft, die eine Reihe von Unternehmen beherbergen wird, von Boston Dynamics bis DeepMind (das B und D des Alphabets). Was meine Aufmerksamkeit erregte, war die Technologie hinter dem Buchstaben O.
OK Google
Ok Google ermöglicht Sprachsuche und Aktivierungsaktionen für Ihre Web- oder mobilen Apps. Verwalten Sie Ihren Kalender, Ihre Navigation, Ihre Unterhaltung und mehr mit Ihrer Stimme und lassen Sie Ok Google die Entschlüsselung durchführen. Sagen Sie einfach „Ok, Google …“
„Sagen Sie beispielsweise ‚Okay Google, ich brauche morgen einen Regenschirm‘, um zu sehen, ob die Wettervorhersage Regen vorhersagt.“
Laut einem Bericht von Android Police ist damit zu rechnen, dass Ok Google schon bald im Offline-Modus arbeiten wird. Der neue Code in der App weist offenbar deutlich auf die Möglichkeit von Sprachbefehlen ohne Internetverbindung hin. Die Anzahl der Zeichenfolgen ist jedoch stark auf Aktionen wie das Abspielen von Musik oder das Senden von Textnachrichten beschränkt.
Google-Befehle
Von Audrey bis Siri … und Barbie
Spracherkennungstechnologie gibt es zwar schon seit einigen Jahrzehnten, doch sie scheint nicht älter zu werden. Die Spracherkennung begann in den 1950er Jahren mit Systemen wie Audrey und erlebte in den 1970er Jahren einen echten Durchbruch. Allerdings verlief der Fortschritt noch recht langsam (versteht das System die Sprache?). In den letzten zwei Jahren hat sich jedoch einiges getan.
„Die erste Frage an die KI lautet: „Gibt es einen Gott?“ Die erste KI-Antwort lautet: „Jetzt schon.“
@ Elon Musk
Googles Spracherkennungstechnologie weist derzeit eine Fehlerrate von nur 81 TP3T auf (2013 waren es noch 231 TP3T). „Einfach ausgedrückt: Maschinelle Spracherkennung wird die Art und Weise, wie Menschen mit ihren Computern interagieren, völlig verändern“, schreibt Tim Tuttle, CEO von Expect Labs. Dank Deep Speech und dem positiven Kreislauf der KI wird die Spracherkennung „unheimlich gut“, wobei die Fortschritte der letzten 18 Monate drastischer sind als die der letzten 15 Jahre zusammen. Laut Tuttle werden Computer uns rund um die Uhr zuhören, und intelligente Sprachschnittstellen werden bald in allen Arten von Apps vorhanden sein.
„Der positive Kreislauf der künstlichen Intelligenz – je mehr sie genutzt wird, desto besser funktioniert sie, da sie mehr Daten sammelt und mehr Benutzer hinzukommen.“
@tim_tuttle
Der Markt testet diese verbesserte Technologie auf vielfältige Weise. Begrüßen Sie die intelligente Barbie, eine Puppe mit Spracherkennung, die mit Benutzern, beispielsweise mit Kindern, die mit ihr spielen, kommunizieren kann. Diese erste interaktive Puppe hat verständlicherweise Datenschutzbedenken aufgeworfen, da persönliche Aufzeichnungen der Gespräche der Kinder mit der Puppe an Drittunternehmen übermittelt werden. „Das mangelnde Verständnis und die mangelnde Einbindung der Kinder, die möglicherweise nicht verstehen, dass ihre Handlungen überwacht werden“, ist ein Problem, das gelöst werden muss, bevor diese Barbie-Puppe aus dem Alltag ausbricht.
Scharfe Worte zum Verstecken?
Eine der beliebtesten Statistiken, die sich heutzutage im Internet verbreitet, ist, dass Millennials mit ihren Handys schlafen. Das ist eine witzige Art zu sagen, dass die Menschen heutzutage, insbesondere die jüngeren Generationen, ihre geliebten Geräte ständig bei sich tragen. Dies unterstreicht das apokalyptische Phänomen des Abhörens, das von der Hollywood-Leinwand in die Köpfe der realen Nutzer gelangt. Werden gottähnliche Systeme Zugriff auf alles haben, was ich sage, und so die Worte an ihre Prediger und Unternehmen weitergeben?
Ok Google versucht, das Datenschutzproblem zu umgehen, indem es einfach "Ok Google" als Hotword verwendet. Erst dann wird die Technologie aktiviert und das Gerät beginnt zuzuhören, was der Nutzer sagt. Ob ein Hotword jedoch sicher genug ist, ist fraglich.
S für Sicherheit
Ich bin beeindruckt vom enormen Potenzial, das Sprache in Maschinen bietet: von nahtlosen Wettervorhersagen und kostengünstigen Anrufen an Menschen auf der ganzen Welt bis hin zu authentischen Gesprächen mit Robotern. Damit Sprache jedoch wirklich eine intelligente Zukunft erreichen kann, muss sie auch einer sicheren Zukunft näherkommen.
Heutzutage vermittelt das ständige Tragen eines digitalen Ohrs eher das Gefühl der Überwachung als der Überwachung der Technologie. Alphabetisch betrachtet, denke ich, hätte Google das S für Sicherheit vergeben sollen.