„Neuer Denkstil“ für Big Data

Big Data - das bedeutet das Sammeln, Verarbeiten und Analysieren riesiger Datenmengen. Doch wie soll man damit umgehen? Der US-Forscher Michael Jordan vertritt die These: Es braucht dafür einen „neuen Denkstil“.

„Es ist sehr leicht, aus Big Data die falschen Schlüsse zu ziehen, weil man nicht wirklich versteht, was dabei passiert. Der Computer macht die ganze Arbeit“, sagt der an der Universität Berkeley (USA) tätige Professor für Statistik und Computerwissenschaft.

Vortrag

Michael Jordan hält am Mittwoch, den 8.11.2017 am Institute of Science and Technology (IST) Austria einen Vortrag zum Thema „Computational Thinking, Inferential Thinking and Data Science“.

Ist etwa bei der Analyse von Bevölkerungsdaten eine Population überproportional vertreten („Oversampling“), dann „weiß“ das der Computer nicht und produziert verzerrte Resultate.

Solche statistischen Unschärfen hätten in den vergangenen Jahren zu einer „Reproduzierbarkeits-Krise“ von wissenschaftlichen Studien geführt. Etwa bei Studien, die Zusammenhänge zwischen einem Gen und einer Krankheit gefunden hatten.

Statistiken zu interpretieren, die eine große Anzahl von Menschen, Kulturen und Situationen überspannen, ist für Jordan „weit schwieriger als alles, was bisher in der Computerwissenschaft gemacht wurde“. Ein Lösungsansatz sei, bei der Auswertung statistische Fehlerkorrekturen wie die „False Discovery Rate“ bereits im Voraus einzuplanen. Doch davon, so Jordan, wüssten viele Informatiker, die diese Systeme planen und bauen, nichts oder noch zu wenig.

Kluft zwischen zwei Welten

Die grundsätzliche Krux, die es zu überwinden gelte, ist die: Wo sich der Statistiker über möglichst viele Daten freut, weil sie genauere Rückschlüsse zulassen, will der Informatiker die Komplexität der Daten reduzieren, um den Überblick zu behalten. Die Kluft zwischen diesen Welten sei zum Teil auf fehlende Schwerpunkte in der Ausbildung zurückzuführen, habe aber auch tiefere Gründe. „Bestehende Konzepte, die beide Sphären unterstützen, stehen eher in Konflikt miteinander, anstatt voneinander zu profitieren“, erklärt Jordan.

Im Wesentlichen gehe es darum, inferentielles Denken - also Schlussfolgerungen auf statistischer Basis - und informatisches Denken stärker, auch institutionell, zu verbinden. „Es wird einiges intellektuelles Sondieren und wahrscheinlich mehrere Jahrzehnte an Forschung brauchen, um Konzepte zu entwickeln, die besser miteinander harmonieren“, so Jordan. Sollte dies gelingen, werde daraus letztlich eine neue akademische Disziplin entstehen.

„Computer sind nicht intelligent“

Der Informatiker, aufgrund seiner Namensgleichheit mit einer US-Basketball-Legende einmal als der „Michael Jordan des Machine Learning“ bezeichnet, hat keine Angst vor einer die Menschheit bedrohenden maschinellen Superintelligenz. Solche Szenarien seien pure Science Fiction und wenn, dann vielleicht erst in 500 Jahren denkbar.

Wahre Intelligenz spricht der „Skeptiker und Optimist“ zumindest den heutigen Computern rundweg ab. Bestenfalls könne man von erweiterter („augmented“) Intelligenz sprechen, die den Menschen unterstützt - etwa bei Suchanfragen im Web, per Spracherkennung oder bei Empfehlungsdiensten.

Selbst die Tatsache, dass Computer mittlerweile in hoch komplexen Spielen wie Go menschliche Spitzenspieler schlagen, heißt für Jordan, der Universitätsabschlüsse in Psychologie, Mathematik und Kognitionswissenschaften vorzuweisen hat, im Grunde „genau gar nichts“: „Ein Computer, der Milliarden von möglichen Pfaden durchforstet und die richtigen findet, das ist eine gute Ingenieursleistung. Das heißt aber nicht, dass der Computer plötzlich superschlau ist.“

science.ORF.at/APA

Mehr zu diesem Thema: