„Blind vor lauter Daten“

Mehr Daten bringen mehr Erkenntnisse - dieses Versprechen könne die medizinische Forschung bei Weitem nicht einlösen, kritisiert der Mathematiker Gerd Antes. Man werde vielmehr vor lauter Daten blind, die Ergebnisse seien oft problematisch.

Werden große Datenmengen ausgewertet, bedeutet das noch lange nicht, am Ende eine brauchbare Entdeckung machen zu können. In einem Microsoft-Labor kam etwa eine Künstliche Intelligenz zu so einem unbrauchbaren Schluss: An Asthma zu leiden, sei demnach ein wirksamer Schutz gegen eine tödlich verlaufende Lungenentzündung. Dass Menschen mit Asthma selten an einer Lungenentzündung sterben, stimmt sicher - jedoch nicht wegen ihrer Grunderkrankung, sondern weil sie genau deswegen öfter zum Arzt gehen.

Der Heuhaufen wird größer

Genau solche Fehlschlüsse seien keine Seltenheit, sagt Gerd Antes. Der Mathematiker und Biometriker war 20 Jahre lang Leiter des deutschen Cochrane-Zentrums für evidenzbasierte Medizin, das die Güte medizinischer Studien und Nachweise für Therapien analysiert und bewertet. Wenn man viele Daten für die Auswertung zur Verfügung habe, finde man darin nicht nur Wahrheiten, sogenannte Signale, sondern auch Rauschen. „Im schlimmsten Fall bedeutet das, bei der Suche nach der Nadel im Heuhaufen nichts zu erreichen, als das Heu zu vergrößern und am Ende sind wir vor lauter Daten blind“, so Antes.

Antes Kritik hat einen aktuellen Hintergrund. Gestern verabschiedete der Deutsche Bundestag ein umstrittenes Gesetz, das sogenannte Digitale-Versorgungs-Gesetz von Gesundheitsminister Jens Spahn. Ein Passus darin sorgte im Vorfeld für Aufregung: Das Gesetz des CDU-Ministers macht es möglich, dass die Daten von 73 Millionen Krankenversicherten zukünftig an die Forschung weitergeleitet werden, ohne bei den Betroffenen nachzufragen. In Österreich hat die Forschung Zugang zu den Daten der elektronischen Krankenakte ELGA. Eine Entwicklung, die Antes scharf kritisiert.

Von Kausalität zu Korrelation

Würden große Datenmengen analysiert, würden meist nur Korrelationen hergestellt und die seien mitunter verfänglich. Als Beispiel nennt Antes den Rückgang von Storchenpopulationen bei gleichzeitigem Sinken der Geburtenzahlen in der Bevölkerung. „Hier gibt es eine statistische Korrelation, das lässt aber nicht den kausalen Schluss zu, die Störche würden die Babys bringen“, so Antes.

Forschung mit Big Data könne funktionieren, wendet der Mathematiker ein. Das habe beispielsweise die Klimaforschung demonstriert. Dort wurden die entsprechenden Rechenmodelle über Jahrzehnte hinweg entwickelt. Die Klimaforschung zeige aber auch, dass große Datenmengen statistische Fehlschlüsse zulassen - das würde von Klimawandelskeptiker immer wieder demonstriert.

Sorgsamer Umgang mit Daten

Antes plädiert deswegen dafür, sorgsamer mit persönlichen Daten umzugehen, sei das in Sozialen Medien, bei der Nutzung von Gesundheitsapps auf dem Smartphone oder von Versicherungsseite her. Die Big Data-Forschung müsse erst ihren Nutzen unter Beweis stellen, bevor man mit sensiblen Daten freizügiger umgehen könne.

In Österreich beklagen Forscherinnen und Forscher immer wieder strenge Datenschutzauflagen für medizinische Informationen – das behindere die Wissenschaft, etwa wenn es sich um Langzeitanalysen der Bevölkerung handle. Zumindest die Daten der elektronischen Krankenakte ELGA stehen in Österreich laut Forschungsorganisationsesetz für wissenschaftliche Zwecke zur Verfügung. Eine Ombudsstelle entscheidet über die Weitergabe öffentliche und private Forschungseinrichtungen.

Marlene Nowotny, Ö1 Wissenschaft