Sprachassistenten sind die neuen Orakel von Delphi

Mit den Sprachassistenten von Amazon, Google, Microsoft und Apple bekommen wir das Orakel von Delphi wieder zurück, und zwar überall und jederzeit. Dank künstlicher Intelligenz können wir den neuen Orakeln jederzeit unsere Fragen stellen.
 
(Bild: Gorondenkoff / shuttertstock.com)
 
Delphi war eine Stadt im antiken Griechenland, die vor allem für ihr Orakel, einer Weissagungsstätte, bekannt war. Das Orakel von Delphi gab zunächst nur einmal im Jahr am Geburtstag des Apollon Auskunft, später am siebten Tag der Sommermonate. Im Winter legte es für drei Monate eine Pause ein. Die Kultstätte von Delphi mit dem Orakel war die wichtigste der hellenischen Welt und bestand bis in die Spätantike. Delphi galt lange Zeit sogar als Mittelpunkt der Welt. Das Orakel konnte Dinge voraussagen. Zum Beispiel prophezeite das Orakel von Delphi Laios, dem König von Theben, dass sein Sohn ihn dereinst töten und seine Frau heiraten werde. Sein Sohn hiess Ödipus.
 
Die Sprachassistenten von Amazon, Google, Microsoft und Apple können zwar nicht die Zukunft voraussagen wie das Orakel von Delphi, doch immerhin haben sie Zugriff auf das gesamte Wissen im Internet. 
 
Mein bevorzugtes Orakel ist der Google Assistant. Früher war Google eine Suchmaschine, mit der wir mit einzelnen Suchbegriffen nach relevanten Informationen suchten. Google versteht seit einiger Zeit Sprache, das heisst, man muss seine Suchbegriffe nicht mehr eintippen, sondern kann sie sprechen. Google ist heute weit mehr als eine Suchmaschine. Dank künstlicher Intelligenz kann man seine Fragen wie damals dem Orakel in einer natürlichen Sprache stellen. Kürzlich wollte ich wissen, wie der CEO von Novartis heisst. Früher hätte man ins Suchfeld von Google «CEO Novartis» eingegeben. Heute sagt man «OK Google. Wie heisst der CEO von Novartis?» Googles Antwort erfolgt auditiv und visuell: «Der CEO von Novartis ist Vasant Narasimhan». Manchmal erfolgt Googles Antwort wie früher in Form eines relevanten Links. 
 
Der Sprachassistent von Amazon heisst offiziell Amazon Echo, doch nennen ihn alle Alexa. Alexa kann Programme ausführen. Diese werden bei Amazon Echo nicht Programm genannt, sondern Skill. In der Kategorie Taxi & Mitfahrgelegenheiten gibt es mehrere Anbieter, unter anderem Uber, wo man seine Fahrt bestellen kann. «Alexa, sage Uber ich möchte eine Fahrt bestellen.» Dank einem geführten Dialog kann man so mit natürlicher Sprache sein Taxi reservieren. Natürlich kann Alexa dank vielen Skills viel mehr Aufgaben ausführen.
 
Noch weiter geht der Bot bzw. Assistant von Google, Google Duplex. Dieser übernimmt schon bald selbständig Aufgaben wie einen Termin für den Reifenwechsel beim Automechaniker in der Garage, den Termin beim Coiffeur oder die Tischreservation im Restaurant. Dank KI weiss der Bot zum Beispiel, wann mein bevorzugter Termin und wer mein Friseur ist. 
 
 

Gesichtserkennung statt Passwort

Die Gesichtserkennung dank KI wird von vielen argwöhnisch betrachtet. Im öffentlichen Raum kann das durchaus heikel sein, z.B. vor Stadien, um Hooligans mit Stadionverbot frühzeitig zu erkennen. Wenn ich meinen Computer starte, muss ich nur kurz die Webcam aktivieren und schon werde ich von Windows erkannt und persönlich begrüsst, ohne dass ich ein Passwort eingeben muss. Dank KI ist das möglich und erst noch viel bequemer. Besitzer eines neueren iPhones sind sich das schon länger gewohnt, dass sie dank der Face Recognition kein Passwort mehr erfassen müssen. 
 
 

Können Sie portugiesisch?

Dank Google Translate muss man nicht mehr mühsam Sprachen lernen. Englisch würde ich davon ausnehmen. Diese Weltsprache sollte man einfach mehr oder wenig beherrschen. Wenn Sie in einem Land Ferien machen, dann wollen Sie vermutlich für diese kurze Zeit nicht die Sprache erlernen. Ausnahmen davon sind die Höflichkeitsfloskeln wie Guten Morgen, Guten Abend, Danke und Bitte. Diese kann man in jedem Reiseführer nachschlagen. Dank Google Translate geht das noch viel einfacher. Sie sprechen auf Deutsch den gewünschten Satz, wie z.B. «Guten Tag, haben Sie ein Zimmer für zwei Nächte?». Dieser Satz wird nun von der App erkannt und aus dem Audiofile wird es in einen Text transkribiert und in die Cloud hochgeladen. Dort wird er nun von Google interpretiert, in die Zielsprache übersetzt und ein Audiofile für die Sprachausgabe generiert. In Sekundenschnelle sagt die App auf portugiesisch: «Olá, você tem quarto para duas noites?». Ein Muttersprachler mag jetzt vielleicht einwerfen, dass diese Übersetzung nicht ganz perfekt sei. Doch ist eine schlechte Übersetzung immer noch besser als gar keine. Und dank KI wird diese immer besser.
 
Die beste Übersetzung derzeit gibt es bei deepl.com. Ich musste vor einigen Monaten einen 25-seitigen Vertrag von Englisch auf Deutsch übersetzen. Was denken Sie, wie lange brauchte ich, um diesen übersetzen zu lassen? Unglaubliche 45 Sekunden hat das gedauert. Ich musste nur das Wordfile hochladen und nach eben diesen 45 Sekunden kam es übersetzt zurück. Die Qualität war unglaublich gut und verbessert sich dank Big Data und KI immer mehr.
 
 

Sprechen Sie bereits mit Ihrem Smartphone, oder tippen Sie noch?

In Vorträgen demonstriere ich immer die KI mit einem Diktat in mein Smartphone. Dank dem Google Assistenten und KI funktioniert das unglaublich gut. Ich spreche dann immer mindestens doppelt so schnell, um zu zeigen, wie gut das geht. Erstaunlicherweise machen das noch recht wenig Leute, obwohl sie diese Funktion kennen. Bei meiner Frage antworten höchstens 10 Prozent, dass sie die Spracheingabe der Texteingabe vorziehen. Versuchen Sie es doch einmal. Für iPhone-User ist es Siri, die das auch schon ganz gut kann.
 
 

«Papa, wie heisst diese Blume?»

Als Vater kennen Sie diesen Satz ganz bestimmt. Sie hören ihn dann, wenn Ihre Kinder am Wegrand eine Blume gesehen haben. Mir ging es früher oft so, dass ich dann keine Antwort auf diese Frage hatte. Damals, als meine Kinder noch klein waren, hatte ich dieses neue Orakel noch nicht dabei. 
 
Dank der Bildsuchmaschine von Google, Google Lens, kann man sein Smartphone auf die besagte Blume halten und schon zeigt Google die mögliche Bezeichnung an. Google Lens kann aber noch viel mehr. Es kann einen Text scannen und übersetzen, z.B. eine Speisekarte oder ein Plakat. Es kann neben Pflanzen auch Tiere identifizieren. Zudem kann man die Umgebung entdecken, indem man über Sehenswürdigkeiten mehr Informationen abrufen kann, z.B. wann sie erbaut wurden oder wie die Öffnungszeiten sind. Mit Google Lens lassen sich QR- und Barcodes ganz schnell scannen und die passenden Infos dazu abrufen.
 
 

«Du, wie heisst dieses Lied?»

Diese Frage kennen Sie bestimmt auch. Man ist mit dem Auto unterwegs, das Radio läuft. Plötzlich hört man einen Song, zu dem uns aber der Titel oder Interpret nicht einfällt. Dank der App Shazam sind wir uns schon lange gewohnt, diese Information abzurufen. Mit dem Google Assistant geht das heute noch schneller und bequemer: «Ok Google. Wie heisst dieses Lied?». Der Vorteil ist hier, dass man während der Autofahrt nicht am Handy hantieren muss, um die App aufzurufen, sondern einfach das Smartphone fragen kann, genau wie das Orakel von Delphi.
 
 

Liebe KI, schreib doch diesen Artikel für mich

Was vor wenigen Jahren als Science-Fiction abgetan worden wäre, ist heute Realität. Die KI GPT-3 ist heute schon in der Lage, einen Text selbst zu schreiben. Es bedarf nur einer kleinen Einführung von wenigen Sätzen mit den relevanten Stichworten, damit diese KI einen längeren Artikel selbst schreiben kann, heute vorerst nur auf Englisch. Entwickelt wurde GPT-3 von OpenAI, einer Firma, die auf die Entwicklung und Erforschung Künstlicher Intelligenz spezialisiert ist. Einer der Gründer ist Elon Musk.
 
Die Menschen damals in der Antike hätten sich die neuen Orakel, die wir heute dank KI zur Verfügung haben, vermutlich nicht in ihren kühnsten Träumen erahnen können. Wir aber vor dem Smartphone-Zeitalter auch nicht, dass das so wie heute einmal möglich sein wird. Heute haben wir es und es entwickelt sich rasch weiter und wird immer perfekter.
 
 

Der Autor

Jörg Eugster ist ein Onlinepionier der ersten Stunde. Er engagiert er sich als begeisterter Botschafter der digitalen Zukunft. Anders als viele Bedenkenträger schürt der Digitalisierungsoptimist jedoch keine Furcht vor Robotern und künstlicher Intelligenz. Stattdessen setzt er auf das riesige Potenzial der digitalen Revolution, deren Power er als Publizist und Vortragsredner in die Welt trägt.
 
 

 

Magazin kostenlos abonnieren

Abonnieren Sie das topsoft Fachmagazin kostenlos. 4 x im Jahr in Ihrem Briefkasten.