Sprachassistenten Vorteile und Nachteile

Sprachassistenten: Vorteile und Nachteile für die Privatsphäre

23.02.2022

Sprachsuche und Sprachsteuerung im Alltag

Digitale Sprachassistenten sollen uns den Alltag erleichtern. Durch einen kurzen Sprachbefehl machen sie es möglich, gezielt Musik zu hören, das Licht ein- und auszuschalten oder Essen zu bestellen. Sie erinnern uns an Termine, erstellen unsere Einkaufsliste oder stellen unseren Wecker. Auch Smart Home-Systeme oder einzelne Geräte können wir via Sprachsteuerung fernsteuern, beispielsweise Heizungen, die Beleuchtung, unsere Waschmaschine oder die Kaffeemaschine. Bei vielen sind Sprachsuche und Sprachsteuerung im Alltag angekommen.

Die bekanntesten und beliebtesten Assistenten sind Amazons Alexa, Siri (Apple), der Google Assistent, Microsoft Cortana und Samsung Bixby. Sie sind allesamt dafür da, unsere Sprache in Aktionen umzusetzen und auch deshalb sehr beliebt, weil ihre Bedienung oft selbst für Technik-Laien recht einfach ist.

Aber wie sieht es bei den Sprachassistenten mit Vorteilen und Nachteilen für die Privatsphäre aus?

Es gibt zumindest einige Menschen, die sich darüber Gedanken machen und die befürchten, dass die Privatsphäre und private Daten nicht ausreichend geschützt sind, wenn man smarte Assistenten nutzt. Deshalb möchten wir im Folgenden erklären, wie digitale Sprachassistenten funktionieren und wie Sie Ihre Daten bestmöglich schützen können.

Die Geschichte der Sprachsteuerung

geschichte-der-sprachsteuerung

Aus der Gegenwart betrachtet scheinen viele Dinge unfassbar weit zurückzuliegen. Wir können uns kein Leben mehr ohne Internet vorstellen und vergessen dabei schnell, dass es das Internet noch gar nicht so lange gibt.

Die Grundlagen wurden in den 1960er-Jahren gelegt. Der erste Sprachcomputer der Welt ist der IBM Shoebox gewesen - und der war weit von dem entfernt, was wir heute kennen. Er konnte nur wenige Wörter und die Ziffern 0 bis 9 erkennen. Dazu noch ein paar einfache mathematische Anweisungen wie plus und minus.

Der Bundesverband Digitale Wirtschaft (BVDW) beschreibt in einem Leitfaden zur Sprachsteuerung, wie schnell wir technisch vom IBM Shoebox in die heutige Zeit gekommen sind. Über eine intelligente Schreibmaschine bei Raumschiff Enterprise (1968) und einen Tom Cruise, der im Science-Fiction-Film "Minority Report" von 2002 seine Wohnung per Sprache steuern konnte - hin zu der Tatsache, dass wir mittlerweile tatsächlich vieles in den eigenen vier Wänden genau so steuern können.

Der Durchbruch kam mit Siri 2011, also vier Jahre nach dem Erscheinen des ersten Apple iPhones. Seit 2015 ist Amazon Alexa auf dem Markt, ein Jahr später kam Google Home. Mittlerweile sind es viele Millionen Menschen, die Siri, Alexa oder Google Home - was mittlerweile in Google Nest umbenannt wurde - nutzen.

Die Technologien werden rasend schnell entwickelt und optimiert. Mittlerweile gibt es noch deutlich mehr Anbieter von Sprachassistenten, die sich auf dem Markt zu behaupten versuchen.

Wie funktionieren Sprachassistenten?

Jeder Sprachassistent ist an ein Gerät gekoppelt. Das kann ein Smartphone, ein Tablet oder einer der bekannten Smart Speaker wie Amazon Echo, Apple HomePod oder Google Nest sein - aber beispielsweise auch ein Auto. Letztendlich handelt es sich immer um eine Software, die unsere gesprochene Sprache aufnimmt, analysiert, in den jeweiligen Kontext einordnet und entsprechend deutet.

Aufgrund dieser Deutung wird die gewünschte Aktion ausgeführt. Der smarte Assistent reagiert also auf das, was wir ihm sagen. Im Allgemeinen wird das auch als Natural Language Processing (NLP) bezeichnet, was wiederum in den Bereich der künstlichen Intelligenz fällt. Gesprochene Sprache wird von einer Technologie verarbeitet, was eine Interaktion zwischen Mensch und Gerät möglich macht.

Optimierung der Sprachsuche

Die Hard- und Softwares sind immer weiter optimiert worden. Als die Technologien vor einigen Jahren auf den Markt gekommen sind, sind sie noch deutlich anfälliger für Fehler gewesen. Sie haben uns nicht richtig verstanden und dementsprechend falsche oder gar keine Aktionen ausgeführt. Mittlerweile werden sogar Dialekte und undeutliche Ausdrucksweisen verstanden und auch Umgebungsgeräusche sind für die Spracherkennung nur noch selten ein Problem. Das sorgt dafür, dass die Akzeptanz der Nutzer:innen immer weiter wächst.

Wir können davon ausgehen, dass die Optimierung der Sprachsuche weitergeht. Die Befehle werden immer komplexer, weshalb auch die KI immer wieder Neues dazulernen muss, um uns zu verstehen. Es wird zum Beispiel oft nicht mehr nach "Wetter Hamm" gefragt. Viel eher lautet der Befehl mittlerweile: "Wie wird das Wetter in Hamm?" Heißt: Die Spracherkennung wird immer mehr auf die alltägliche Sprache ausgerichtet, wobei die Software trotzdem immer noch auf einzelne Keywords (Schlüsselwörter) achtet.

Die eigentliche Verarbeitung findet dann in der Cloud, also auf entsprechenden Servern statt. Die Schlüsselwörter, die wir unserem digitalen Sprachassistenten nennen, werden an passende Apps oder Dienste weitergeleitet - ohne sie könnte der Sprachbefehl nicht umgesetzt werden. In unserem Beispiel wären „Wetter“ und „Hamm“ die Keywords, die an eine Wetter-App geleitet werden. Sie ruft die Daten ab, leitet sie an die Software des Sprachassistenten und der gibt sie als akustisches Signal für uns wieder.

Lernfähigkeit digitaler Assistenten

Die Assistenten können sogar aus Fehlern lernen: Wenn sie uns gar nicht, nicht richtig oder vielleicht sogar komplett falsch verstehen, lernen die Softwares trotzdem dazu. Je öfter ein Schlüsselwort gesagt wird, desto eher kann eine Software es von anderen unterscheiden, verstehen und zuordnen.

Sowohl das als auch die Komplexität der Sprachbefehle weiter auszubauen, ist für die Hersteller von smarten Assistenten und Smart Speakern essenziell, weil sich das Verhalten der Nutzer:innen weiter ändern wird. Jede Generation hat ihre eigene Art zu sprechen und ihre eigene Art, mit Technik umzugehen. Darauf müssen sich die Anbieter einstellen. Dementsprechend müssen Nutzerverhalten und die Art der Interaktion auch in Zukunft von den Geräten beachtet und verstanden werden.

Sprachsuche: Datenschutz & Privatsphäre

datenschutzgrundverordnung-dsgvo
Datenschutzgrundverordnung (DSGVO)

Wie bei jeder Interaktion zwischen uns Menschen und technischen Geräten werden Daten gesammelt, wenn wir Sprachassistenten nutzen. Ohne geht es nicht. Die smarten Helfer funktionieren cloudbasiert. Nur so können sie auf die jeweils relevanten Informationen zugreifen und korrekt auf das reagieren, was wir von ihnen möchten. Das ist die Grundlage aller zentralen Systeme, hinter denen Unternehmen wie Google, Amazon oder Apple stecken.

Es werden also definitiv private Daten auf Servern der jeweiligen Anbieter gespeichert. Eine einhundertprozentige Sicherheit im Internet gibt es nicht. Es besteht also potenziell immer die Gefahr, dass die Daten gehackt, Informationen abgefischt oder Daten kopiert und weiterverkauft werden. Sie sollten sich dessen bewusst sein und wissen, dass dieses Risiko besteht. Wie so oft ist die Überlegung dahinter: Welche Informationen bin ich bereit preiszugeben und wie gefährlich wäre es, wenn sie in falsche Hände kommen. Das Bundesamt für Sicherheit in der Informationstechnik rät auf seiner Website dazu abzuwägen, "ob der persönliche Nutzen so hoch ist, dass er mögliche Sicherheitsrisiken oder Eingriffe in die Privatsphäre überwiegt."

Dazu kommt, dass jeder Anbieter verschiedene Systeme benutzt, weshalb die Frage nach Risiken für Privatsphäre und Datenschutz kaum pauschal beantwortet werden kann. Zumal sich Datenschutzvorgaben unterscheiden: In den USA gelten beispielsweise andere Richtlinien als in der Europäischen Union.

Das BSI listet aber dennoch eine Reihe von Punkten auf, die zumindest für etwas mehr Sicherheit sorgen könnten:

  • Digitale Assistenten auch mal ausschalten. Einige haben es vielleicht schon mal selbst erfahren, dass teilweise auch ungewollt Sprache verarbeitet wird und der Assistent plötzlich im Wohnzimmer oder auf dem Smartphone in der Hosentasche losgeht. Je nach Situation oder wenn man nicht zu Hause ist, einfach mal ausschalten oder deaktivieren.
  • Kritische Sprachbefehle und Bestellungen mit PIN oder Passwort absichern. So können bestimmte Aktionen via Sprachbefehl weder von Kindern noch von Dritten ungewollt ausgeführt werden.
  • Separates WLAN für digitale Assistenten, damit sie von Geräten mit sensiblen Daten wie Smartphones oder Laptops getrennt sind.
  • Daten des Assistenten regelmäßig prüfen und ggf. löschen.
  • Datenschutzeinstellungen anpassen.
  • Bei Erweiterungen oder zusätzlichen Funktionen darauf achten, dass die Quellen sicher und zuverlässig sind.
  • Nur mit Geräten und Accounts verbinden, die für die Funktionalität des Assistenten wichtig sind (auf notwendige Schnittstellen beschränken).

Zusätzlich gibt es für jeden Assistenten Informationen vom Hersteller darüber, wie man die Systeme stummschalten kann und was noch zu beachten ist.

Trotz aller Risiken gibt es aber immer auch diejenigen, die gar keine Lust haben, sich mit all diesen Sicherheitsmaßnahmen und bedenken zu befassen. Blogger und Autor Sascha Lobo hat schon 2018 in einem SPIEGEL-Artikel geschrieben: "Bequemlichkeit schlägt alles, sogar deutsche Bedenken. [...] Wenn sich etwas verändert hat in den letzten Jahren, dann die Grenze, ab der Durchschnittspersonen vernetzte Technologien gruselig finden." Was damals noch skeptisch betrachtet wurde, ist im Zeitalter der Digitalisierung vollkommen normal geworden und wird an vielen Stellen gar nicht großartig hinterfragt. Wer von uns hat nicht schon mal angeklickt, dass AGB und Datenschutzbestimmungen einer bestimmten Seite im Internet gelesen wurden, ohne sie tatsächlich gelesen zu haben. Hin und wieder vertrauen wir blind und je umfangreicher wir uns in Dinge einlesen müssen und je schwieriger sie zu verstehen sind, desto eher gehen wir den bequemen Weg.

Der Reiz der gesprochenen Sprache

Warum ist es für uns Menschen so spannend, digitale Helfer für zum Teil wirklich einfachste Tätigkeiten einzusetzen? Womöglich, weil uns gewisse Aufgaben einfach keinen Spaß machen und es durchaus praktisch ist, wenn sie mithilfe eines einzigen Satzes erledigt werden können. Viele Menschen telefonieren beispielsweise nicht gerne. "Bestell mit eine Pizza Margherita bei meiner Lieblingspizzeria" zu sagen und sie dann prompt geliefert zu bekommen ist für diejenigen deutlich entspannter, als zum Telefon zu greifen oder die ganzen Daten bei einem Lieferdienst einzugeben.

Die Basis des Ganzen ist aber wohl noch viel grundlegender. Obwohl Technik kaum noch wegzudenken ist und die große Mehrheit ein Smartphone und vieles andere besitzt, ist die natürliche Sprache für uns immer noch das Kommunikationsmittel Nummer eins. Der BVDW schreibt in seinem oben bereits benannten Leitfaden:

"Sprache ist wohl die natürlichste Art und Weise der Kommunikation und einfacher als das Tippen auf dem Smartphone."

Das zeigt sich auch dadurch, dass auch Sprachnachrichten bei Messenger-Diensten immer mehr Zuspruch bekommen, zumindest bei jüngeren Generationen.

Fazit

Oft kennen wir die digitalen Sprachassistenten unter einem bestimmten Namen: Alexa, Siri oder Google Assistant. Dabei müssen wir aber zwischen den Softwares an sich und den smarten Geräten unterscheiden. Siri oder Alexa brauchen einen entsprechenden Lautsprecher, um zu funktionieren. Das sind die Geräte, die mit "Amazon Echo", "Apple HomePod" oder "Google Nest" bezeichnet werden. Von denen gibt es wiederum verschiedene Ausführungen und Generationen - also mehrere Produkte hinter jedem der bekannten Markennamen. Derzeit ist Amazon übrigens der führende Anbieter solcher Smart Speaker.

Wie bei allen technischen Geräten und Anwendungen ist es auch bei Sprachassistenten extrem wichtig, dass sie intuitiv funktionieren und einfach zu bedienen sind. Sie müssen Nutzer:innen einen Mehrwert bieten, damit sie akzeptiert und dementsprechend gekauft werden.

amazon-alexa-smart-speaker

Diesbezüglich gibt es noch eine Menge Potenzial nach oben: Anne Toth ist "Director, Alexa Trust" bei Amazon und wird vom Fachmagazin t3n dahingehend zitiert, dass sich in den kommenden Jahren wohl noch weitere Anwendungsfälle für Sprachassistenten ergeben werden, über die wir aktuell noch gar nicht nachdenken. Der Einsatz von Smart Speakern ist allerdings generell noch ausbaufähig, da sie bisher nur von rund 21 Prozent der Deutschen genutzt werden. Im Bereich Voice-Commerce sieht’s noch schlechter aus: Bisher wird nur wenig mithilfe der Stimme und Smart Speakern eingekauft.

Dazu kommt ein Vertrauen, das Hersteller bezüglich Privatsphäre und Daten glaubhaft machen und von den Menschen bekommen müssen. Sprachassistenten haben definitiv Vorteile, aber auch Nachteile für die Privatsphäre, denn ohne private Daten zu speichern und zu verarbeiten, funktionieren sie nicht. Diese Daten landen automatisch auf den Servern der jeweiligen Anbieter weltweit. Und wir wissen: Was einmal im Internet ist, bekommen wir nie wieder raus. Dessen müssen wir uns beim Einsatz von Sprachassistenten, Gegenständen mit Sprachsteuerung oder der Sprachsuche bewusst sein. Im Idealfall hinterfragen wir vor dem Kauf eines digitalen Assistenten, wie schlimm ein Verlust oder eine Zweckentfremdung jener Daten für uns wäre.

Mehr Informationen?

fkt42-informationen

Sind Fragen zum Thema offengeblieben? Oder haben Sie ein anderes Anliegen, bei dem wir Ihnen weiterhelfen können? Kein Problem!

Schreiben Sie uns eine Mail, nutzen Sie unser Kontaktformular oder rufen Sie uns einfach an, um einen Termin zu vereinbaren. Wir beraten Sie und erstellen Ihnen gerne ein Angebot für Ihr Projekt – selbstverständlich kostenlos und unverbindlich!