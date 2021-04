Joseph Turow, Autor des in Kürze erscheinenden Buches „The Voice Catchers“, sagt, dass wir uns im Anfangsstadium einer Revolution der Stimmprofilierung befinden, die die Gefühle, die Privatsphäre und die Brieftaschen der Verbraucher ausnutzt.

Sie entscheiden sich, ein Geschäft anzurufen, das Wanderschuhe verkauft, die Sie kaufen möchten. Während Sie sich einwählen, wird der Computer einer Firma für künstliche Intelligenz aktiviert, die von dem Geschäft beauftragt wurde. Er ruft seine Analyse des Sprachstils ab, den Sie bei Ihren Anrufen bei anderen Unternehmen, die die Softwarefirma betreut, verwendet haben. Der Computer hat festgestellt, dass Sie „freundlich und gesprächig“ sind.

Mit Hilfe von Predictive Routing verbindet er Sie mit einem Kundendienstmitarbeiter, der laut Unternehmensforschung besonders gut darin ist, freundliche und redselige Kunden zum Kauf teurerer Versionen der Waren zu bewegen, die sie in Betracht ziehen.

Diese hypothetische Situation mag wie aus einer fernen Zukunft klingen. Aber solche automatisierten, sprachgesteuerten Marketingaktivitäten finden ständig statt.

Wenn Sie hören: „Dieser Anruf wird zu Schulungs- und Qualitätskontrollzwecken aufgezeichnet“, dann ist es nicht nur der Kundendienstmitarbeiter, der überwacht wird.

Es können auch Sie sein.

Bei der Recherche für mein demnächst erscheinendes Buch „The Voice Catchers: How Marketers Listen In to Exploit Your Feelings, Your Privacy, and Your Wallet“ (Die Stimmenfänger: Wie Vermarkter zuhören, um Ihre Gefühle, Ihre Privatsphäre und Ihren Geldbeutel auszunutzen) habe ich mehr als 1.000 Fachzeitschriften- und Nachrichtenartikel über die Unternehmen durchgesehen, die mit verschiedenen Formen der Stimmprofilierung in Verbindung stehen. Ich untersuchte Hunderte von Seiten der US- und EU-Gesetze, die sich auf biometrische Überwachung beziehen. Ich habe Dutzende von Patenten analysiert. Und weil sich so vieles in dieser Branche entwickelt, sprach ich mit 43 Personen, die daran arbeiten, sie zu gestalten.

Schnell wurde mir klar, dass wir uns in der Anfangsphase einer Revolution der Stimmprofilierung befinden, die von den Unternehmen als integraler Bestandteil der Zukunft des Marketings angesehen wird.

Dank der Akzeptanz von Smart Speakers, intelligenten Autodisplays und sprachgesteuerten Telefonen in der Öffentlichkeit – zusammen mit dem Anstieg der Sprachintelligenz in Call-Centern – sagen Marketer, dass sie kurz davor stehen, KI-gestützte Sprachanalyse-Technologien zu nutzen, um nie dagewesene Einblicke in die Identitäten und Neigungen der Kunden zu erhalten. Sie glauben, dass sie damit die Fehler und den Betrug umgehen können, die mit traditioneller zielgerichteter Werbung verbunden sind.

Menschen können nicht nur anhand ihrer Sprachmuster profiliert werden, sondern auch anhand des Klangs ihrer Stimmen – der laut einigen Forschern einzigartig ist und ihre Gefühle, Persönlichkeiten und sogar ihre körperlichen Merkmale offenbaren kann.

Schwachstellen in der gezielten Werbung

Die von mir befragten Top-Marketing-Führungskräfte sagten, dass sie erwarten, dass ihre Kundeninteraktionen innerhalb eines Jahrzehnts oder so ein Stimmprofiling beinhalten werden.

Ein Teil dessen, was sie an dieser neuen Technologie reizt, ist die Überzeugung, dass das derzeitige digitale System der Erstellung einzigartiger Kundenprofile – und der anschließenden gezielten Ansprache mit personalisierten Nachrichten, Angeboten und Werbung – große Nachteile hat.

Eine schwelende Sorge unter den Internet-Werbern, die in den 2010er Jahren an die Öffentlichkeit drang, ist, dass die Kundendaten oft nicht aktuell sind, dass Profile auf mehreren Nutzern eines Geräts basieren, dass Namen verwechselt werden können und dass Menschen lügen.

Werbetreibende sind auch beunruhigt über Ad-Blocking und Klickbetrug, was passiert, wenn eine Website oder App Bots oder schlecht bezahlte Arbeiter einsetzt, um auf dort geschaltete Anzeigen zu klicken, so dass die Werbetreibenden zahlen müssen.

All dies sind Hindernisse für das Verständnis einzelner Käufer.

Die Sprachanalyse hingegen wird als eine Lösung gesehen, die es Menschen nahezu unmöglich macht, ihre Gefühle zu verbergen oder ihre Identitäten zu verschleiern.

Aufbau der Infrastruktur

Die meisten Aktivitäten im Bereich der Stimmprofilierung finden in Kunden-Support-Centern statt, die größtenteils nicht im Blickfeld der Öffentlichkeit sind.

Aber es gibt auch Hunderte von Millionen Amazon Echos, Google Nests und andere intelligente Lautsprecher da draußen. Auch Smartphones enthalten solche Technologie.

Alle hören zu und nehmen die individuellen Stimmen der Menschen auf. Sie reagieren auf ihre Wünsche. Aber die Assistenten sind auch mit fortschrittlichen Programmen für maschinelles Lernen und tiefe neuronale Netzwerke verbunden, die analysieren, was Sie sagen und wie Sie es sagen.

Amazon und Google – die führenden Anbieter von intelligenten Lautsprechern außerhalb Chinas – scheinen auf diesen Geräten nur wenig Sprachanalyse zu betreiben, die über das Erkennen und Reagieren auf individuelle Besitzer hinausgeht. Vielleicht fürchten sie, dass ein zu weites Ausreizen der Technologie an dieser Stelle zu schlechter Publicity führen würde.

Nichtsdestotrotz geben die Nutzervereinbarungen von Amazon und Google – wie auch von Pandora, Bank of America und anderen Unternehmen, auf die Menschen routinemäßig über Telefon-Apps zugreifen – ihnen das Recht, ihre digitalen Assistenten zu nutzen, um Sie anhand Ihrer Stimme zu verstehen.

Amazons bisher öffentlichste Anwendung der Stimmprofilierung ist sein Halo-Armband, das behauptet, die Emotionen zu kennen, die Sie vermitteln, wenn Sie mit Verwandten, Freunden und Arbeitgebern sprechen.

Das Unternehmen versichert seinen Kunden, dass es die Halo-Daten nicht für eigene Zwecke verwendet. Aber es ist eindeutig ein Proof-of-Concept – und ein Fingerzeig in Richtung Zukunft.

Patente weisen in die Zukunft

Die Patente dieser Tech-Unternehmen bieten eine Vision dessen, was kommen wird.

In einem Amazon-Patent erkennt ein Gerät mit dem Alexa-Assistenten Unregelmäßigkeiten in der Sprache einer Frau, die auf eine Erkältung hindeuten, indem es „eine Analyse der Tonhöhe, des Pulses, der Intonation, des Zitterns und/oder der Harmonizität der Stimme eines Benutzers verwendet, die aus der Verarbeitung der Sprachdaten ermittelt wird.“ Aufgrund dieser Schlussfolgerung fragt Alexa, ob die Frau ein Rezept für Hühnersuppe haben möchte. Wenn sie nein sagt, bietet es ihr an, ihr Hustenbonbons mit einer einstündigen Lieferung zu verkaufen.

Ein weiteres Amazon-Patent schlägt eine App vor, die einem Verkäufer in einem Geschäft hilft, die Stimme eines Käufers zu entschlüsseln, um unbewusste Reaktionen auf Produkte auszuloten. Die Behauptung ist, dass die Art und Weise, wie Menschen klingen, angeblich einen besseren Hinweis darauf gibt, was Menschen mögen, als ihre Worte.

Und eine von Googles eigenen Erfindungen beinhaltet die Verfolgung von Familienmitgliedern in Echtzeit mit Hilfe von speziellen Mikrofonen, die im ganzen Haus platziert werden. Basierend auf der Tonhöhe der Stimmsignaturen schließen die Google-Schaltkreise auf Informationen zu Geschlecht und Alter – zum Beispiel ein erwachsener Mann und ein weibliches Kind – und kennzeichnen sie als separate Personen.

Das Patent des Unternehmens behauptet, dass der „Haushaltsrichtlinien-Manager“ des Systems im Laufe der Zeit in der Lage sein wird, Lebensmuster zu vergleichen, z. B. wann und wie lange die Familienmitglieder Mahlzeiten einnehmen, wie lange die Kinder fernsehen und wann elektronische Spielgeräte in Betrieb sind – und das System dann bessere Essenszeiten für die Kinder vorschlagen oder anbieten kann, den Fernsehkonsum und das Spielen zu kontrollieren.

Verführerische Überwachung

Im Westen beginnt der Weg in diese Werbezukunft damit, dass Firmen ihre Nutzer dazu bringen, ihnen die Erlaubnis zum Sammeln von Sprachdaten zu geben. Die Firmen erhalten die Erlaubnis der Kunden, indem sie sie zum Kauf preiswerter Sprachtechnologien verleiten.

Wenn die Technologieunternehmen die Software zur Sprachanalyse weiterentwickelt haben – und die Menschen immer mehr auf Sprachgeräte angewiesen sind – erwarte ich, dass die Unternehmen mit der weit verbreiteten Profilerstellung und dem Marketing auf der Basis von Sprachdaten beginnen werden. Die Unternehmen werden sich an den Buchstaben, wenn nicht sogar an den Geist der bestehenden Datenschutzgesetze halten, und ich gehe davon aus, dass sie ihre neuen Inkarnationen vorantreiben werden, auch wenn die meisten ihrer Nutzer bereits vor der Existenz dieses neuen Geschäftsmodells beigetreten sind.

Diese klassische Lockvogeltaktik kennzeichnete sowohl den Aufstieg von Google als auch von Facebook. Erst als die Zahl der Nutzer dieser Seiten groß genug wurde, um hoch bezahlte Werbekunden anzuziehen, verfestigten sich ihre Geschäftsmodelle auf den Verkauf von Anzeigen, die auf das zugeschnitten waren, was Google und Facebook über ihre Nutzer wussten.

Zu diesem Zeitpunkt waren die Websites zu einem so wichtigen Bestandteil der täglichen Aktivitäten ihrer Nutzer geworden, dass die Leute das Gefühl hatten, sie könnten nicht mehr weg, trotz ihrer Bedenken bezüglich der Datensammlung und -analyse, die sie nicht verstanden und nicht kontrollieren konnten.

Diese Strategie beginnt sich bereits auszuwirken, da zig Millionen von Verbrauchern Amazon Echos zu Schleuderpreisen kaufen.

Die dunkle Seite des Voice Profiling

Hier ist der Haken: Es ist nicht klar, wie genau die Stimmprofilierung ist, besonders wenn es um Emotionen geht.

Es ist wahr, so die Carnegie Mellon Stimmerkennungswissenschaftlerin Rita Singh, dass die Aktivität Ihrer Stimmnerven mit Ihrem emotionalen Zustand verbunden ist. Singh sagte mir jedoch, dass sie befürchtet, dass mit der leichten Verfügbarkeit von Machine-Learning-Paketen Menschen mit begrenzten Kenntnissen dazu verleitet werden, die Stimmen von Menschen schlampig zu analysieren, was zu Schlussfolgerungen führt, die ebenso zweifelhaft sind wie die Methoden.

Sie argumentiert auch, dass Schlussfolgerungen, die die Physiologie mit Emotionen und Formen von Stress verbinden, kulturell voreingenommen und fehleranfällig sein können. Diese Bedenken haben Marketingfachleute nicht abgeschreckt, die typischerweise Stimmprofile verwenden, um Rückschlüsse auf die Emotionen, Einstellungen und Persönlichkeiten von Personen zu ziehen.

Während einige dieser Fortschritte das Leben einfacher machen, ist es nicht schwer zu erkennen, wie die Sprachtechnologie missbraucht und ausgenutzt werden kann. Was wäre, wenn die Stimmprofilierung einem potenziellen Arbeitgeber sagt, dass Sie ein schlechtes Risiko für einen Job sind, den Sie begehren oder dringend brauchen? Was, wenn es einer Bank sagt, dass Sie ein schlechtes Risiko für einen Kredit sind? Was ist, wenn ein Restaurant entscheidet, dass es Ihre Reservierung nicht annimmt, weil Sie zu anspruchsvoll klingen, oder zu anspruchsvoll?

Bedenken Sie auch die Diskriminierung, die stattfinden kann, wenn Stimmprofiler den Behauptungen einiger Wissenschaftler folgen, dass es möglich ist, anhand der Vokalisationen einer Person auf deren Größe, Gewicht, Rasse, Geschlecht und Gesundheit zu schließen.

Schon jetzt werden Menschen aufgrund der von Unternehmen gesammelten persönlichen Informationen unterschiedlichen Angeboten und Möglichkeiten unterworfen. Voice Profiling fügt ein besonders heimtückisches Mittel zur Kennzeichnung hinzu. Heute verlangen einige Staaten wie Illinois und Texas, dass Unternehmen um Erlaubnis fragen, bevor sie Analysen von Stimm-, Gesichts- oder anderen biometrischen Merkmalen durchführen.

Aber andere Staaten erwarten, dass sich die Menschen über die Informationen, die über sie gesammelt werden, aus den Datenschutzrichtlinien oder Nutzungsbedingungen bewusst sind – was bedeutet, dass sie das selten tun. Und die Bundesregierung hat noch kein umfassendes Gesetz zur Marketingüberwachung erlassen.

Angesichts der sich abzeichnenden weit verbreiteten Einführung von Sprachanalyse-Technologien ist es wichtig, dass die Verantwortlichen in der Regierung Richtlinien und Vorschriften erlassen, die die persönlichen Informationen schützen, die durch den Klang der Stimme einer Person offenbart werden.

Ein Vorschlag: Während die Verwendung von Stimmauthentifizierung – oder die Verwendung der Stimme einer Person zum Nachweis ihrer Identität – unter bestimmten, sorgfältig geregelten Umständen erlaubt werden könnte, sollte jegliche Stimmprofilierung in der Interaktion von Marketern mit Einzelpersonen verboten werden. Dieses Verbot sollte auch für politische Kampagnen und für Regierungsaktivitäten ohne Durchsuchungsbefehl gelten.

Dies scheint der beste Weg zu sein, um sicherzustellen, dass die kommende Ära der Stimmprofilierung eingeschränkt wird, bevor sie zu sehr in das tägliche Leben integriert und zu allgegenwärtig wird, um sie zu kontrollieren.