Unabhängige Analysen und Informationen zu Geopolitik, Wirtschaft, Gesundheit, Technologie

Zentralisierung von Covid-Daten: Google finanziert gigantische Datenbank sammelt individuelle Infektionsdaten, verfolgt den Reiseverlauf und 40 weitere Variablen

Diese Woche wurde eine große internationale Datenbank zur Untersuchung von Coronavirus-Infektionen ins Leben gerufen. Sie soll Aufschluss darüber geben, wie schnell sich neue Varianten unter den Menschen ausbreiten, ob die derzeit verfügbaren Impfstoffe einen guten Schutz dagegen bieten und wie lange die Immunität der Menschen gegen das Virus anhält. Die Tatsache, dass Google bei der Erstellung mitgewirkt hat, führt jedoch zu Bedenken hinsichtlich des Datenschutzes.

Das neue Repository wurde mit finanzieller und technischer Unterstützung von Google und der Rockefeller Foundation ins Leben gerufen. Es wurde von einem Team von Forschern aus sieben akademischen Institutionen in den USA und Europa erstellt und mit Informationen von 24 Millionen Fällen aus 150 Ländern gestartet.

Dieses Repository sammelt eine noch nie dagewesene Menge an Informationen über einzelne Fälle an einem einzigen Ort. Die Informationen zu jeder einzelnen Person sind angeblich anonymisiert und enthalten bis zu 40 Variablen, wie z. B. das Datum, an dem die Person zum ersten Mal Symptome zeigte, das Datum, an dem sie positiv auf das Virus getestet wurde und ihre Reisegeschichte.

Es wurde entwickelt, nachdem eine gemeinsame Google-Tabelle, die von Epidemiologen auf der ganzen Welt verwendet wurde, um die Krankheit zu verfolgen, überlastet war. Google-Ingenieure halfen dabei, Computercodes zu schreiben, um die täglichen COVID-19-Daten von 60 Regierungen auf der ganzen Welt automatisch in einem standardisierten Format hochzuladen und gleichzeitig doppelte Einträge zu löschen.

Die Epidemiologin Caitlin Rivers von der Johns Hopkins Bloomberg School of Public Health sagte, dass diese Art von Daten nützlich sein wird, um festzustellen, wie sich die Krankheit ausbreitet. Die Forscher hoffen, dass die Datenbank es ihnen ermöglicht, die Impfstoffe und Varianten der Krankheit in den kommenden Monaten zu überwachen und als Vorlage für die Verfolgung von Echtzeitdaten künftiger Epidemien zu dienen.

Hätte es eine solche Datenbank bereits zu einem früheren Zeitpunkt des Ausbruchs gegeben, so glauben die Wissenschaftler, hätten Epidemiologen möglicherweise nachweisen können, dass sich das Virus in China häufig von Mensch zu Mensch ausbreitete, lange bevor die Weltgesundheitsorganisation dies zugab – etwas, das dazu beigetragen haben könnte, dass die Pandemie nicht so weit außer Kontrolle geriet.

Die Wissenschaftler haben gesagt, dass die Erweiterung der Datenbank zu einer anpassungsfähigen Plattform zur Erfassung anderer Krankheiten bei zukünftigen Epidemien die Unterstützung eines Unternehmens oder einer gemeinnützigen Organisation erfordern würde, um voranzukommen.

Werden “anonymisierte” Daten wirklich anonym bleiben?

Jedes Mal, wenn es eine öffentliche Datenbank wie diese gibt, insbesondere wenn Google beteiligt ist, gibt es große Bedenken bezüglich des Datenschutzes. Google hat nicht die beste Erfolgsbilanz, wenn es um den Schutz der Daten von Menschen geht, und war Gegenstand unzähliger Klagen im Zusammenhang mit der Verletzung der Privatsphäre. Obwohl sich die Architekten des Projekts Berichten zufolge mit Ethik- und Rechtsexperten über den sicheren Umgang mit anonymisierten Daten beraten haben, gibt es auch Bedenken, dass Hacker in der Lage sein könnten, die Daten mit bestimmten Personen in Verbindung zu bringen.

Jeder kann sich registrieren, um auf bis zu 8 GB der Daten in der Global.health-Datenbank zuzugreifen. Für rund 12 Millionen der Fälle haben die Forscher Daten für ein Dutzend Variablen gesammelt, bei einem Zehntel der Fälle sind es mehr. Es ist nicht notwendig, sich anzumelden, um die Kartenansicht der Fälle zu sehen, die nach Variante und Land aufgeschlüsselt werden können.

Auf der Website von Global.health heißt es: “Das erste einfach zu bedienende globale Datenarchiv mit offenem Zugang zu epidemiologischen, anonymisierten Linienlistendaten in Echtzeit.” Benutzer können sich mit ihrem Google-Konto oder durch Angabe einer E-Mail-Adresse anmelden.

Zwischen Ausbruchsdatenbanken, Apps zur Kontaktverfolgung und Impfstofflisten wachsen die Risiken für die Privatsphäre der Menschen, während die Pandemie weiter voranschreitet. In einer idealen Welt wird diese Datenbank Epidemiologen die Informationen liefern, die sie benötigen, um diese Krankheit zu verstehen, aber wenn Google beteiligt ist, ist das Potenzial für Probleme hoch.

ScientificAmerican.com

Global.Health