Was ist Datenvisualisierung?

Datenvisualisierung ist das wichtigste Werkzeug um große Datenmengen in angemessener Zeit zu erfassen, zu verstehen und datenbasiert Entscheidungen zu treffen. Warum das so ist, wird in diesem Artikel erklärt.
Die Kernidee ist, Daten nicht nur textuell, numerisch oder tabellarisch, sondern mit visuellen Mitteln (Linien, geometrische Formen, Farbe, Position, Symbole usw.) zu präsentieren.
Mehrere dieser visuellen Elemente formen Diagramme wie ein Liniendiagramm, das übrigens schon im 18. Jahrhundert von einem Schotten namens William Playfair erfunde wurde.
Neben den bekannten Balken-, Linien- und Kreisdiagrammen gibt es freilich eine Vielzahl anderer Diagrammtypen, wie die Seite Data Viz Project und die immense Anzahl an Beispielen der bekannten Visualisierungsbibliothek d3.js zeigen.
Wozu überhaupt Daten visualisieren?
Playfairs Arbeit war wohl auch von Joseph Priestley inspiriert. 1765 publizierte er eine Art Timeline Plot, in dem die Lebensspannen berühmter Persönlichkeiten als Balken dargestellt wurden. Playfair erfand ein wenig später einige der heute geläufigsten Diagramme, um wirtschaftliche Zusammenhänge verständlich zu erklären.
Aber Priestleys Anwendung zeigt für sich schon warum Menschen Daten visualisieren: Durch die Präsentation der Lebensspannen als Balken, konnten diese ohne große Mühe verglichen werden — ein Unterfangen, das mit einer bloßen Tabelle ungleich zeitaufwendiger und mühsamer ist.
Daraus folgt:
Werden Daten graphisch dargestellt, ermöglicht dies, komplexe und große Datenmengen in angemessener Zeit zu erfassen, zu verstehen und basierend darauf Handlungen abzuleiten.
Oder anders gesagt, ohne Visualisierung wäre der Mensch was Daten betrifft fast "blind".
Warum funktioniert Datenvisualisierung?
Unsere Augen sind von Natur aus darauf getrimmt, visuelle Muster in unserer Umgebung – und zwar unbewusst und parallel – zu erkennen. Diese Fähigkeit mit den geeigneten Visualisierungsformen auszunutzen, ist das, was Datenvisualisierung so hilfreich macht.
So gibt es gewisse visuelle Merkmale (pre-attentive attributes) wie
- die Länge von Linien,
- unterschiedliche Farben oder
- die 2D Position von visuellen Elementen,
die wir mit unserem Auge parallel vorfiltern, ohne dass es unser Bewusstsein bedarf.
Komplexere visuelle Formen, wie zum Beispiel Buchstaben und Ziffern, benötigen hingegen unser Bewusstsein und können nur sequentiell, also hintereinander und damit viel langsamer verarbeitet werden. Die parallele Vorverarbeitung ist laut Studien ungefähr 20.000 mal schneller als die sequentielle, bewusste Verarbeitung – was Sie übrigens gerade tun, indem Sie diesen Text lesen.
Weiterführende Information
Als ich 2014 mit der Umsetzung eines Dashboards für das Monitoring eines Warenlagers betraut wurde, war ich unzufrieden. Ich begann mich damit zu beschäftigen, wie man Daten richtig präsentiert. Bei meinen Recherchen bin ich bald auf Edward Tufte und Stephen Few gestoßen. Zusammen mit Colin Ware haben sie einige der Standardwerke in diesem Fachgebiet veröffentlicht:
- The Visual Display of Quantitative Information, Edward Tufte
- Information Visualization: Perception for Design, Colin Ware
- Show Me the Numbers: Designing Tables and Graphs to Enlighten, Stephen Few
- Information Dashboard Design, Stephen Few
Einer meiner weiteren Artikel gibt 8 Tipps um bessere Dashboards zu gestalten.