Unabhängige Analysen und Informationen zu Geopolitik, Wirtschaft, Gesundheit, Technologie

JoeBakal / Shutterstock.com (Shutterstock)

Google will alles, was Sie online posten, für die KI auslesen

Eine Aktualisierung der Datenschutzrichtlinien von Google deutet darauf hin, dass das gesamte öffentliche Internet Freiwild für seine KI-Projekte ist.

Google hat am Wochenende seine Datenschutzrichtlinien aktualisiert. Darin heißt es ausdrücklich, dass sich das Unternehmen das Recht vorbehält, so ziemlich alles, was Sie online posten, für den Aufbau seiner KI-Tools zu scrapen. Wenn Google Ihre Worte lesen kann, gehen Sie davon aus, dass sie jetzt dem Unternehmen gehören, und erwarten Sie, dass sie sich in den Eingeweiden eines Chatbots einnisten.

“Google verwendet die Informationen, um unsere Dienste zu verbessern und neue Produkte, Funktionen und Technologien zu entwickeln, die unseren Nutzern und der Öffentlichkeit zugute kommen”, heißt es in den neuen Google-Richtlinien. “Wir verwenden zum Beispiel öffentlich verfügbare Informationen, um Googles KI-Modelle zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud-KI-Funktionen zu entwickeln.”

Zum Glück für Fans der Geschichte unterhält Google eine Geschichte von Änderungen an seinen Nutzungsbedingungen. Die neue Formulierung ändert eine bestehende Richtlinie und beschreibt neue Möglichkeiten, wie Ihre Online-Meinungen für die Arbeit der KI-Tools des Tech-Riesen verwendet werden können.

Zuvor hieß es, die Daten würden “für Sprachmodelle” und nicht für “KI-Modelle” verwendet, und wo in der älteren Richtlinie nur Google Translate erwähnt wurde, tauchen jetzt Bard und Cloud AI auf.

Dies ist eine ungewöhnliche Klausel für eine Datenschutzrichtlinie. Normalerweise beschreiben diese Richtlinien die Art und Weise, wie ein Unternehmen die Informationen verwendet, die Sie in den eigenen Diensten des Unternehmens veröffentlichen. Hier scheint sich Google das Recht vorzubehalten, Daten zu sammeln und zu nutzen, die in einem Teil des öffentlichen Webs gepostet werden, als ob das gesamte Internet der eigene KI-Spielplatz des Unternehmens wäre. Google reagierte nicht sofort auf eine Anfrage zur Stellungnahme.

Diese Praxis wirft neue und interessante Fragen zum Datenschutz auf. Die meisten Menschen wissen, dass öffentliche Beiträge öffentlich sind. Aber heute benötigt man ein neues mentales Modell dafür, was es bedeutet, etwas online zu schreiben. Es geht nicht mehr darum, wer die Informationen sehen kann, sondern darum, wie sie verwendet werden könnten. Es ist möglich, dass Bard und ChatGPT Ihre längst vergessenen Blogeinträge oder 15 Jahre alten Restaurantkritiken in sich aufgenommen haben. Während Sie dies lesen, könnten die Chatbots eine humonkuloide Version Ihrer Worte auf eine Art und Weise wiederkäuen, die unmöglich vorherzusagen und schwer zu verstehen ist.

Eine der weniger offensichtlichen Komplikationen in der Welt nach ChatGPT ist die Frage, woher die datenhungrigen Chatbots ihre Informationen beziehen. Unternehmen wie Google und OpenAI haben große Teile des Internets ausgewertet, um ihre Robotergewohnheiten zu unterstützen. Es ist keineswegs klar, ob dies legal ist, und in den nächsten Jahren werden sich die Gerichte mit Fragen des Urheberrechts auseinandersetzen, die vor einigen Jahren noch wie Science Fiction erschienen wären. In der Zwischenzeit wirkt sich das Phänomen bereits auf unerwartete Weise auf die Verbraucher aus.

Die Machthaber von Twitter und Reddit fühlen sich von der KI-Problematik besonders betroffen und haben umstrittene Änderungen vorgenommen, um ihre Plattformen abzuschotten. Beide Unternehmen schalteten den freien Zugang zu ihren APIs ab, über die jeder, der wollte, große Mengen von Beiträgen herunterladen konnte. Angeblich soll dies die sozialen Netzwerke davor schützen, dass andere Unternehmen ihr geistiges Eigentum abgreifen, aber es hatte auch andere Folgen.

Die API-Änderungen von Twitter und Reddit führten dazu, dass Tools von Drittanbietern, die viele Nutzer für den Zugriff auf diese Websites verwendeten, nicht mehr funktionieren. Eine Minute lang sah es sogar so aus, als würde Twitter öffentliche Einrichtungen wie Wetterdienste, Verkehrsbetriebe und Notdienste dazu zwingen, für Tweets zu zahlen, ein Schritt, den das Unternehmen nach einem Hagel von Kritik wieder zurücknahm.

In letzter Zeit ist Web-Scraping der Lieblingsfeind von Elon Musk. Musk machte für eine Reihe von Twitter-Katastrophen in letzter Zeit das Bedürfnis des Unternehmens verantwortlich, andere davon abzuhalten, Daten von seiner Website abzuziehen, auch wenn die Probleme scheinbar nichts damit zu tun haben. Am Wochenende beschränkte Twitter die Anzahl der Tweets, die sich Nutzer pro Tag ansehen durften, und machte den Dienst damit fast unbrauchbar. Musk sagte, dies sei eine notwendige Reaktion auf “Datenabschürfungen” und “Systemmanipulation”. Die meisten IT-Experten waren sich jedoch einig, dass die Ratenbegrenzung eher eine Krisenreaktion auf technische Probleme war, die durch Missmanagement, Inkompetenz oder beides entstanden sind. Twitter hat die Fragen von Gizmodo zu diesem Thema nicht beantwortet.