Balkendiagramm der AGES
AGES
AGES
Corona-Visualisierungen

Auf einen Blick verständlich – oder auch nicht

Infektionskurven, Falldiagramme und Spitals-Landkarten: Das Coronavirus hat auch die Visualisierung von Daten enorm verbreitet. Die bunten Darstellungen sind oft auf einen Blick zu verstehen – doch genau diese unmittelbare Verständlichkeit ist kritisch zu hinterfragen, schreibt die Visualisierungsexpertin Johanna Schmidt in einem Gastbeitrag.

Der Umgang mit Daten, Fakten und Informationen ist ein wichtiger Teil unseres täglichen Lebens geworden. Die Coronavirus-Pandemie ist da nicht ausgenommen, hat diese doch zu einer neuen Flut an verfügbaren Daten bestehend aus Infektionszahlen, Todesfällen und Testraten geführt. Plötzlich ist es notwendig, wichtige Informationen über Statistiken, Modelle und Ergebnisse zu verstehen und zu vermitteln.

Porträtbild von Johanna Schmidt
VRVis

Zur Autorin

Johanna Schmidt leitet die Visual Analytics-Gruppe des Wiener Forschungszentrums VRVis und lehrt an der TU Wien und an der FH Salzburg. Sie ist Gründungsmitglied von IEEE Women in Engineering Austria und derzeit mit dem Thema Data Literacy Teil des w-fFORTE Innovatorinnen-Programms der FFG.

Wir Menschen sind evolutionär darauf vorbereitet, visuelle Informationen gut und schnell verarbeiten zu können. Bevor wir noch Texte lesen konnten, waren wir schon darauf angewiesen, Farben und Formen schnell interpretieren zu können. Wenn sich beispielsweise ein Objekt hinter einem Gestrüpp verbirgt, können wir es trotzdem leicht erkennen – unser Gehirn versteht es nach wie vor, fehlende Informationen bei visuellen Eindrücken zu ergänzen, und ermöglicht es uns daher, sehr schnell Muster und Formen zu sehen. Nicht umsonst haben die meisten Kulturen Sprichwörter wie „Bilder sagen mehr als tausend Worte“. Doch trotz unserer Stärke, komplexe Informationen mit nur einem Blick erfassen zu können, sind wir gleichzeitig sehr schlecht darin, Zahlenreihen zu interpretieren und zu analysieren. Schon lange gab es daher ein Bestreben von Menschen, abstrakte Informationen in Bilder „zu übersetzen“.

Die Darstellung von Daten in Form von visuellen Elementen – Graphen und Plots – wird als Datenvisualisierung bezeichnet. Dabei werden Daten durch Computerunterstützung visuell dargestellt (als Grafiken, Plots, Infografiken), um dem Menschen die Analyse zu erleichtern oder überhaupt erst zu ermöglichen. Durch interaktive Analysemethoden am Computer können wir einen Dialog mit den Daten starten und in vielen Fällen ist es uns überhaupt nur so möglich, einen Überblick über große, komplexe und heterogene Datenmengen zu bekommen.

Dashboards zum Coronavirus

Die vorherrschende Darstellungsform für Corona-Daten sind Dashboards. Als Dashboards werden in der Datenvisualisierung Informationspanels bezeichnet, die üblicherweise aus verschiedenen Grafiken und Plots bestehen und unterschiedliche Ansichten auf die dahinterliegenden Daten anbieten. Mit einem Dashboard kann ein Sachverhalt anhand von verschiedenen Aspekten betrachtet und analysiert werden. Im Falle des österreichischen Corona-Dashboards der AGES, beispielsweise, werden Kennzahlen, eine Kartenansicht, Balkendiagramme und ein zeitlicher Verlauf der Zahlen dargestellt. Damit kann ein solches Dashboard mehrere Fragen beantworten, zum Beispiel „Wie ist der aktuelle Stand der Fälle?“ oder „Wie ist die Verteilung nach Altersgruppen und Geschlecht?“.

 Ausschnitt des AGES-Dashboards vom 4.12.
AGES
Ausschnitt des AGES-Dashboards vom 4.12.2020

Das Dashboard des Robert Koch-Instituts in Deutschland verwendet sehr ähnliche Elemente zur Darstellung der Informationen, wie wir sie auch in Österreich einsetzen. Das Corona-Dashboard mit Daten der Schweiz von Daniel Probst bietet zusätzlich noch die Darstellung des zeitlichen Verlaufs in Form einer sogenannten Heatmap, in der Zeiteinheiten (z.B. Tage) grafisch durch Rechtecke dargestellt und diese anhand der Daten farblich markiert werden. Damit lässt sich beispielsweise die Frage beantworten: „Wie haben sich die Neuinfektionen in den einzelnen Bundesländern über die Zeit entwickelt?“

Diese Beispiele zeigen, dass Dashboard-Darstellungen einen schnellen und niederschwelligen Zugang zu den Daten bieten können. Die Verwendung von leicht verständlichen Grafiken stellt sicher, dass die Darstellungen auch von einem breiten Publikum gut verstanden werden. Weitere Anzeichen von gutem Design und einer professionellen Vorgangsweise sind die Angabe von Quellen und Mitwirkenden. Einige Dashboards bieten sogar Kontaktmöglichkeiten wie Telefonnummern oder E-Mail-Adressen, um Kommentare, Korrekturen oder Fragen zu deponieren. Die Pandemie hat Datenvisualisierung in den Mittelpunkt gerückt, und die Verbreitung von Dashboards trägt wesentlich dazu bei, das Verständnis und die Kompetenz zum Lesen von Grafiken und Plots in der Bevölkerung zu verbessern („Data Literacy“).

“Unmittelbare Verständlichkeit“ kritisch zu hinterfragen

Dashboards in der Form, wie sie momentan eingesetzt werden, sind aber durchaus auch mit Vorsicht zu genießen. Die Daten, die wir betrachten, sind immer aggregierte Darstellungen der realen Zahlen. Trotzdem vermitteln uns grafische und visuelle Darstellungen eben gerade durch ihre „unmittelbare Verständlichkeit“ sehr schnell das Gefühl einer „Absolutheit“, die oftmals kritiklos akzeptiert wird; anders übrigens als z.B. Statistiken, die mittlerweile eher kritisch hinterfragt werden.

Die bestehende Unsicherheit in den Daten, sowie die schwierige Kommunizierbarkeit derselben, bleibt jedoch generell ein Problem bei jeder statistischen Analyse oder visuellen Darstellung. Das betrifft den Umgang mit fehlenden Daten genauso wie die Darstellung von Vorhersagen, etwa über zukünftige Infektionsraten oder Todesfälle. Beispielsweise wird die Symptomatik der positiv getesteten Personen in keinem Dashboard ausgeführt. Auch Änderungen der Metriken – wenn sich beispielsweise die Regeln für die Bestätigung von COVID-19-Fällen ändern – werden in den Dashboards nicht explizit ausgewiesen.

Balkendiagramm der AGES vom 4.12.
AGES
Balkendiagramm der AGES vom 4.12.2020

Unsicherheiten hinter der Visualisierung

Außerdem spiegeln die Dashboards nur die aktuellen Zahlen wider, liefern aber keine weiterführenden Informationen wie beispielsweise die Demografie der Bevölkerung in bestimmten Regionen. Der Vergleich von verschiedenen Städten, Bundesländern oder auch Ländern ist somit schwierig, auch da unterschiedliche Zähl- und Teststrategien nicht berücksichtigt werden. Ein wenig wurde die Vergleichbarkeit der Fälle verbessert, insofern als dass – anders als im Frühjahr und Sommer – in den Dashboards die Fallzahlen für Fälle pro 100.000 Einwohner angezeigt werden können.

Trotzdem bleibt nach wie vor die Problematik der unterschiedlichen Teststrategien, welche damit noch nicht abgebildet wird. All die genannten Unsicherheiten, die durchaus in den Daten existieren, können in den verwendeten, einfachen Formen der Datenvisualisierung – wie etwa Balkendiagramme und Karten – nicht berücksichtigt werden, und werden daher allzu leicht übersehen.

Balken leichter verständlich als Torten

Wie bewertet man den Erfolg der Dashboards, als auf Datenvisualisierung spezialisierte Forscherin? Die globale Auseinandersetzung mit Datendarstellungen begrüße ich sehr, und ebenso den öffentlichen Diskurs dazu. Vieles an den Dashboards entspricht den grundlegenden Forschungsergebnissen, einiges nicht. Der Weg von einem Datensatz hin zu einer verständlichen, aussagekräftigen und faktenbasierten Datenvisualisierung ist nicht klar vorgegeben. Hier müssen viele Entscheidungen getroffen werden: die Art der Darstellung (z.B. Balken- oder Tortendiagramme), Farben, Beschriftungen, etwa von Achsen oder Zahlenskalen, und natürlich der richtige Kontext. Falsche Entscheidungen in diesen Bereichen können dazu führen, dass die der Visualisierung zugrundeliegenden Daten nicht richtig interpretiert werden können.

Sowohl beim Erstellen von Datenvisualisierungen als auch beim Betrachten dieser ist daher darauf zu achten, inwieweit die Darstellung noch immer die Fakten widerspiegelt, die auch in den Daten gefunden wurden. In weiterer Folge ist es wichtig, die kognitiven und wahrnehmungspsychologischen Eigenschaften von uns Menschen zu berücksichtigen. Einige wichtige Erkenntnisse aus der Forschung in diesem Bereich wurden in den aktuellen Dashboards bereits umgesetzt. Beispielsweise sind Menschen beim Betrachten von visuellen Darstellungen sehr schlecht darin, Flächen miteinander zu vergleichen. Ein Tortendiagramm ist daher weniger gut zu lesen als ein Balkendiagramm, in dem die Werte der einzelnen Balken sehr genau abgelesen werden können. Die Dashboards verwenden durchgehend Balkendiagramme zur Darstellung der Daten, was aus Forschungssicht sehr positiv ist.

Zwei Visualisierungen im Farb-Vergleich
MicroStrategy/RKI

Achtung vor Farben

Weniger erfreut sind wir als Forschungscommunity nach wie vor über den Einsatz von Farben: Farben sind ein sehr starker visueller Reiz für uns Menschen und sollten daher immer nur sehr gezielt und gut überlegt eingesetzt werden. Der Einsatz einer bestimmten Farbskala beeinflusst die gesamte Visualisierung entscheidend, vor allem wenn es sich um Landkartendarstellungen handelt. In Dashboards werden oft zu viele Farben auf einmal verwendet, was in weiterer Folge die Analyse der Daten erschwert.

Auch wird bei der Farbauswahl oft nicht auf häufig auftretende Sehschwächen (z.B. Rot-Grün-Blindheit) Rücksicht genommen. Zwei Beispiele im Bild oben: Links zu sehen ist die schlechte Wahl einer Rot-Grün-Farbpalette, welche die Analyse für Personen mit Rot-Grün-Sehschwäche erschwert bis unmöglich macht (Quelle: MicroStrategy). Besser können die Fallzahlen mit einem kontinuierlichen Farbverlauf (rechts) dargestellt werden (Quelle: Robert Koch-Institut).

Leider fehlt in so gut wie allen Dashboards die Möglichkeit, die Farbpalette benutzerseitig zu ändern. Dies ist ein Beispiel dafür, dass in der Datenvisualisierung der Schritt von der Forschung zur Anwendung noch nicht vollständig vollzogen ist. Wir am VRVis Forschungszentrum arbeiten daher weiterhin mit Hochdruck daran, dass Forschungsergebnisse aus der Datenvisualisierung auch in der Praxis breite – und ihre optimale – Anwendung finden.