Big Data

Hochauflösende Karten zu Armutsverteilung

Um Armut zu bekämpfen, braucht es hochauflösende Karten zur Verteilung von Wohlstand als Entscheidungsgrundlage. Gerade in ärmeren Ländern mangelt es aber oft an entsprechend umfassenden Erhebungen. Mit Satellitenbildern und Metadaten aus Social-Media-Diensten generierten Wiener Forscherinnen und Forscher nun hochauflösende „Armutskarten“.

Ein Team der Central European University (CEU) und des Complexity Science Hub Vienna (CSH) um Lisette Espín-Noboa, die an beiden Forschungseinrichtungen tätig ist, stellt neue Berechnungsmodelle vor, die die Verarbeitung großer, komplexer Datensätze – Big Data – und maschinelles Lernen integrieren. Angewendet wurden diese Modelle beispielhaft für die von Armut betroffenen Länder Uganda und Sierra Leone.

Die in Zusammenarbeit mit János Kertész and Márton Karsai erstellten, vergleichsweise hochauflösenden Karten zur Armut könnten politischen Entscheidungsträgern und Nichtregierungsorganisationen helfen, „die wirklich ärmsten Gebiete in einem Land zu identifizieren“ und bessere Maßnahmen zur Bekämpfung von Armut zu treffen, so Espín-Noboa.

Volkszählungen könnten nur eingeschränkt Informationen über schwer erreichbare, abgelegene Gebiete liefern, sie seien zudem teuer und zeitintensiv. Die Kombination von Sensor- und Online-Crowd-Sourcing-Daten mit Methoden des maschinellen Lernens hätten in jüngster Zeit zur Erstellung von Armutskarten beigetragen, aber sie würden bisher z. B. keine lokalen Wohlstandsschwankungen erfassen.

900 Indikatoren für Wohlstand

„Wir wollten wissen, wie der Wohlstand innerhalb eines Gebietes variiert und ob es Ungleichheiten gibt. Wir schlagen daher eine Reihe von maschinellen Lernmodellen vor, um den Mittelwert und die Standardabweichung des Wohlstands über mehrere geografisch geclusterte, bewohnte Orte hinweg abzuleiten und so auch Vorhersagen für alle Teilpopulationen liefern zu können“, so die Computerwissenschaftlerin.

Datengrundlage für die neuen Modelle bildeten die in traditionell durchgeführten Umfragen erhobenen Haushaltsdaten, aus welchen für beide afrikanische Länder Werte des Internationalen Wohlstandsindex berechnet wurden. Zudem griffen die Forscherinnen und Forscher auf Datensätze aus Satellitenbildern sowie Metadaten, die aus Crowdsourcing-Quellen wie OpenStreetMap und Social-Media-Quellen wie Google und Meta (Facebook) abgeleitet wurden, zurück.

Daraus wurde ersichtlich, wie viele Menschen bestimmte Gebiete besuchen, wie viele Facebook-Nutzer ein iPhone besitzen, wie viele Antennen für den Handyempfang in einem Gebiet installiert sind oder auch, wie viele Geldautomaten in einem bestimmten Gebiet vorhanden sind – allesamt Indikatoren, die mit Wohlstand assoziiert werden können. Insgesamt extrahierte das Forschungsteam über 900 Merkmale.

„‚One size fits all‘ funktioniert nur selten“

Anhand ihrer drei entwickelten Modelle – eines basierend auf Satellitenbildern, eines auf Grundlage der Metadaten von Crowdsourcing und sozialer Medien und eines als Kombination aus den zwei vorangegangenen – erzeugten sie ihre „Armutskarten“ für Gemeinden in Uganda und Sierra Leone. Dabei habe sich wieder gezeigt, so die Studienautorin, dass „one size fits all“ nur selten funktioniert: In Sierra Leone ist das kombinierte Modell vor allem nützlich, Regionen mit sehr hohem Einkommen zu erfassen; das Metadaten-Modell funktioniert hier für sehr arme ländliche Regionen am besten. In Uganda ist es genau umgekehrt, Metadaten identifizieren hier die reichen und die Kombination die ärmsten Gebiete.

Zudem seien Reichtum und Armut in verschiedenen Ländern mit unterschiedlichen Merkmalen besser erfassbar: Die Bevölkerungsdichte habe sich als beste Variable erwiesen, um Armutsgebiete in Sierra Leone abzubilden, während es die Intensität des Nachtlichts in Uganda war. Uganda sei etwas reicher als Sierra Leone und habe mit höheren Anteilen an besser gestellten Wohnorten daher wohl auch eine höhere Aussagekraft von Nachtlichtintensität erlaubt, nimmt die Forscherin an. Das Merkmal mit der zweitbesten Aussagekraft war in beiden Fällen Mobilität.

Auch Daten für Österreich geplant

Ihre Methoden für die Kartierung der Wohlstandsverteilung testet das Team nun in Ungarn, Österreich und Ecuador, sagt Espín-Noboa, die selbst aus Ecuador stammt. Spannend sei, ihr Herangehen für Länder auf unterschiedlichen Kontinenten und mit unterschiedlichen Definitionen von Armut zu testen. So habe sich etwa schon gezeigt, dass in Ungarn, im Gegensatz zu den zwei afrikanischen Ländern, vor allem demografische Social-Media-Daten, z. B. über den Besitz eines iPhones, eines Masterabschlusses oder ähnliches, recht aufschlussreich seien. Ergebnisse für Österreich erwarten die Forscherinnen und Forscher gegen Ende des Jahres.