Big Data zwischen Fluch und Segen?

Immer mehr Sensoren in der Umwelt, immer mehr digitale Spuren von Menschen: Zusammen ergibt das riesige Datenmengen. Keine Angst vor Big Data, aber informierte Vorsicht gegenüber digitalen Medien – dafür plädiert die Technikexpertin Katja Schechtner in einem Gastbeitrag.

Ein lauer Sommerabend in der Stadt. Bald soll der Star die Festivalbühne betreten. Doch im Westen gehen heftige Gewitter nieder. Kann das Konzert stattfinden? Sind die Besucher sicher? Wer kann helfen, diese Entscheidung zu treffen?

Porträtfoto von Katja Schechtner
AIT

Die Autorin

Die Städteplanerin und Mobilitätsexpertin Katja Schechtner arbeitet am MIT Media Laboratory in Boston und für die Asian Development Bank in Manila. Zurzeit ist sie Gastprofessorin an der Universität für Angewandte Kunst und an der Technischen Universität in Wien.

Bei solchen Fragen greifen die Verantwortlichen heute auf computergestützte Berechnungsmodelle zurück, die in Sekundenbruchteilen große Mengen an Daten über Wetterverhältnisse, Besucherdichten und Kapazitäten aller öffentlichen und privaten Verkehrsmittel mit einer noch größeren Menge historischer Daten abgleichen und so eine Vorhersage liefern: „Ja, das Konzert kann stattfinden.“

Das Gewitter wird mit großer Wahrscheinlichkeit abgeschwächt im Süden vorbeiziehen; und selbst wenn es doch noch kommen sollte, ist die Evakuierung innerhalb von einer halben Stunde zu schaffen. Auch eine Analyse der sozialen Medien wie Twitter und Facebook kann ergeben: Die Stimmung unter den Besuchern ist gut, aber nicht enthusiastisch. Viele rechnen mit Niederschlägen und haben Regenjacken mit. Es ist also auch keine Panikreaktion zu erwarten, wenn es doch noch anfängt zu regnen.

Von Small Data zu Big Data

Nicht nur bei Großveranstaltungen, auch in der täglichen Organisation von Wasser-, Strom-, und Gesundheitsversorgung greifen Unternehmen und Verwaltungen auf die Analyse großer Datenmengen zurück, um die Versorgung effizient sicherzustellen.

Verschiedene Daten zu sammeln, um verändernd eingreifen zu können, ist an sich nicht neu: im Jahr 1854 kam der Arzt John Snow erstmals auf die Idee, die Wohnorte aller Cholerakranken auf einer Landkarte Londons einzuzeichnen. Schnell erkannte er eine Häufung in der Nähe eines bestimmten Gemeinschaftsbrunnens. Als dieser gesperrt wurde, war die Epidemie gestoppt.

Neu sind heute die Dimensionen der Datenmengen: riesige, sich ständig erneuernde, fast alle Aspekte der Umwelt und des menschlichen Lebens umfassende Datenaufzeichnungen, die mit manuellen oder einfach nachvollziehbaren statistischen Methoden der Datenanalyse nicht mehr verarbeitet werden können. Diese Sammlung, Speicherung und komplexe Auswertung digitaler Daten wird unter dem Begriff Big Data zusammengefasst.

Menschen und Sensoren liefern die Daten

Seminare beim Forum Alpbach

Im Rahmen des Europäischen Forums Alpbach leitet Katja Schechtner das Seminar „Big Data verstehen“ und hält einen Vortrag bei den Technologiegesprächen. science.ORF.at stellt dieses und weitere Seminare in Form von Gastbeiträgen vor. Bisher erschienen:

Links

Dabei wird übersehen, dass es sich bei Big Data nicht um eine abgrenzte, fertig ausgeformte Technologie handelt, sondern dass die besondere Herausforderung im Zusammenspiel sich ständig weiterentwickelnder Einzelkomponenten liegt. Diese werden oft unmittelbar eingesetzt und so im Alltag ungeplant zu komplexen Systemen zusammengebastelt und getestet. (Literatur: „Inscribing a Square: Urban Data as Public Space“)

In der Datensammlung liefern sich neue Sensoren, die unsere Umwelt besser vermessen als je zuvor, ein Kopf an Kopf Rennen mit den Informationen, die Menschen über ihre Interessen, Vorlieben und alltäglichen Entscheidungen mittels sozialer Medien, der Nutzung von Kundenkarten und Apps über sich teilen. So wird zum Beispiel der Verkehr in einer Stadt von Kameras, Magnetfeldsensoren, Drucksensoren und Radaranlagen ebenso erfasst, wie über die Auswertung der digitalen Ortungsspuren, die Navigationsgeräte und Mobiltelefone mit Satelliten und Servern austauschen, und auch Statusmeldungen zum „Check In“ an bestimmten Orten via soziale Medien können Hinweise darüber liefern, wo sich wie viele Menschen gerade bewegen.

Ein ebenso großer Wettbewerb herrscht in der Entwicklung der Auswertemethoden für diese Datenmengen, die versuchen Muster zu erkennen und miteinander in Beziehung zu setzen, ohne dabei aus tatsächlich voneinander unabhängigen Auffälligkeiten falsche Abhängigkeiten herauszulesen.

Sind Fahrradfahrer arm oder reich?

Gerade wenn aus großen, ganz neu verknüpften Datenmengen Schlüsse über menschliches Verhalten gezogen werden, können Datenanalysen zu ambivalenten Ergebnissen führen. So kann man z.B. schlüssig argumentieren, dass, „wer Fahrrad fährt, arm ist“. Denn, so unsere Erklärung: „Wahrscheinlich kann er sich kein Auto leisten“. Doch genauso kann die Analyse ergeben: „Wer Fahrrad fährt, ist reich“. Denn, so die ebenso einleuchtende Erklärung: „Sie kann sich offensichtlich leisten, nahe genug bei der Arbeitsstelle zu wohnen.“ (Watts, Everything is obvious)

Und genau hier – in der Verknüpfung von Datensätzen, wissenschaftlichen Methoden und fragwürdigen Schlussfolgerungen - liegt der Knackpunkt der Frage, welche Rahmenbedingungen, Regeln und Gesetze für Big Data gelten sollen: Welche Daten, die ursprünglich nicht mit einem gemeinsamen Ziel im gleichen Zusammenhang erhoben wurden, müssen/dürfen/können/sollen/wollen gemeinsam mit welchen Werkzeugen ausgewertet werden?

Und daraus abgeleitet: Sind diese Ergebnisse zuverlässig genug, um davon Entscheidungen in einer vielfältig vernetzten Welt abzuleiten? (Barabasi, Network Science) Werden diese Entscheidungen transparent und nachvollziehbar getroffen? Und wie wirken sich diese Entscheidungen auf das Verhältnis des Einzelnen zur Gesellschaft aus?

Teil einer britischen Kunstausstellung: In einem dunklen Raum wird ein Mann von weißen Zahlencodes angstrahlt, die aus dem Internet stammen
APA/AFP/Justin Tallis
Live-Show bei einer Ausstellung zum Thema Big Data in London im Dezember 2015

Zwischen Utopie und Schreckensszenarien

Big Data ist heute eine lebende Versuchsanordnung, die alle Lebensbereiche betrifft und zu der Forschung, Wirtschaft, Politik, Medien und jeder einzelne Mensch alltäglich beitragen. Dies bedeutet auch, dass die sozialen und politischen Umwälzungen, die sich daraus ergeben können, genau dann bewältigt werden, wenn sich alle mit dem Thema angemessen auseinandersetzen und nicht einfach zwischen den beiden extremen Bildern wählen, die die öffentliche Diskussion zu Big Data prägen.

Um beim Beispiel Mobilität zu bleiben: Auf der einen Seite wird die Angst geschürt, dass man in Zukunft keine KfZ-Versicherung mehr bekommen könnte, weil man bei Onlinespielen von Grand Theft Auto ein zu hohes Risikoverhalten gezeigt hat. Auf der anderen Seite wird die Utopie einer uns vollautomatisch umsorgenden Umwelt gezeichnet, die all unsere Wünsche antizipiert und jeden einzelnen Unfall und jeden Stau, in dem wir stecken, verhindert.

Eine angemessene Auseinandersetzung bedeutet auch, dass sich die privaten NutzerInnen von kostenlosen Angeboten im Netz darüber bewusst sind, dass sie mit ihren persönlichen Daten bezahlen.

Jeder einzelne Nutzer von Internetangeboten und Apps kennt das: Sobald man auf einer Seite für zum Beispiel Segelschiffe rumgestöbert hat, werden ständig Angebote für neue Jachten und die schönsten Segeltörns auf fast jeder anderen Seite, die man aufruft, angezeigt. Wie das funktioniert, ist noch einigermaßen klar: Man hat durch das Suchen eines bestimmten Begriffs in einer kostenlosen Suchmaschine eine elektronische Duftmarke, ein „Cookie“, gesetzt, die von vielen verschiedenen, automatisierten Werbungsprogrammen, an die die digitale Duftspur verkauft wurde, erkannt wird. Diese rufen nun wie ein Kanon verzweifelter Marktschreier bei jedem weiteren Besuch des World Wide Web: „Schöne Schiffe, schnelle Schiffe. Billige Boote, heute Boote billiger.“

Zusammenspiel von Eigenverantwortung und Politik

Und hier greift dann – genau in wie in der realen Welt – sowohl die Eigenverantwortung, wie auch Wettbewerbsgesetz und Konsumentenschutz und Politik. Vom Einschalten des gesunden Menschenverstandes, indem man einer Spieleapp nicht Zugang zu allen Emails und privaten Dokumenten geben sollte, nur um gratis spielen zu können), über die Nutzung von durch die Wirtschaft zur Verfügung gestellten Datenschutztools und Sicherheitschecks für den eigenen Browser bis hin zur Forderung, dass die Politik Gesetze erlässt, die ihre BürgerInnen gemäß der gewachsenen Sozial- und Wirtschaftskultur schützen.

Ö1 Hinweise

Eine Reihe von Sendungen begleitet das Europäische Forum Alpbach 2016 in Ö1. Die Technologiegespräche stehen im Mittelpunkt von Beiträgen in den Journalen, in Wissen aktuell, in den Dimensionen und bei der Kinderuni.

Mitglieder des Ö1 Club erhalten beim Europäischen Forum Alpbach eine Ermäßigung von zehn Prozent.

Schwieriger wird das, wenn im Hintergrund nicht mehr nachvollziehbar die verschiedensten Daten und Branchen verknüpft werden. Genau deshalb ist es auch die Verantwortung von ExpertInnen der verschiedensten Fächer, sich ein grundlegendes Verständnis über Informationstechnologien – und ja: auch über mathematische Werkzeuge – zu erarbeiten, um so in ihren eigenen Feldern Risiken abwägen können und informierte Entscheidungen treffen. ÄrztInnen, BetriebswirtInnen, KünstlerInnen, TheologInnen, SoziologInnen, JournalistInnen und PolitikerInnen können so Datentechnologien besser in ihrem Aufgabengebiet einsetzen und auch entscheidend mitgestalten.

In diesem Zusammenspiel zwischen NutzerInnen und Politik sind Big Data ForscherInnen nicht nur gefordert, neue und besser funktionierende Methoden und Werkzeuge zu entwickeln, sondern vor allem ihre Arbeit so zu vermitteln, dass sie verstanden werden kann.

Anstatt: „Wir werden die systemischen Risiken der hybriden Datenquellen durch die Entwicklung von agilen Algorithmen für agentenbasierte Simulationsmodelle reduzieren“. Einfach: „Es ist nicht ganz klar, wie die unterschiedlichen Daten von Wetter bis Verkehr verknüpft werden können, sodass wir eine zuverlässige Aussage liefern können. Aber die Berechnungsmethoden, die wir entwickeln werden, können flexibel neue Erkenntnisse berücksichtigen. So können Menschen und Maschinen dann gemeinsam zuverlässiger die Entscheidung treffen: ‘Ja das Konzert kann stattfinden.‘“

Einen spannenden Versuch zu dieser trans/inter/anti-disziplinären Diskussion starten wir im Rahmen des Big Data Seminars in Alpbach.

Mehr zu dem Thema: