GEXF Vizz – Warum Diagramme nicht langweilig sein sollten

1 Aug

Mittlerweile habe ich den „Circos Teil“ meiner Webanwendung beinahe vollständig erledigt und möchte deswegen zum Abschluss der Blogposts über Circos ein wenig abschweifen und über die Auswirkungen von Circos und den dazugehörigen Visualisierung reden, die meiner Meinung nach eine große Rolle spielen.

Hin und wieder findet man ja mal sehr gut aussehende Infografiken die den Betrachter irgendwie direkt in ihren Bann ziehen (weil sie in ihrem Design aus der Menge heraus stechen uns etwas neues bieten; einen Anreiz, dass man diese Grafik sehen möchte) und man einfach unbedingt wissen möchte was man in dieser Grafik an Information findet. Spontan würde mir dabei zum Beispiel diese beiden Grafiken einfallen:

 

Colors of the web und die 2010 Social Networking Map.

Natürlich gehört zum Erzeugen von solchen Grafiken eigentlich relativ viel Talent, Erfahrung in diesem Bereich und Zeit. Häufig ist es nun allerdings meiner Erfahrung nach so, dass gerade bei Wissenschaftlern die letzten beiden Aspekte ein wenig zu kurz kommen. Die Wissenschaftler haben in der Regel keine Zeit um sich großartig mit dem Design von ihren Grafiken zu beschäftigen und daraus folgt, dass sie auch nicht viel Erfahrung darin haben solche Infografiken zu erzeugen. Dadurch kostet das Erzeugen von schönen herausstechenden Infografiken noch mehr Zeit und die Menge von ebensolchen wird noch kleiner. Es entstehen die typischen mehr oder weniger langweiligen, einfachen Diagramme die vermutlich jeder von uns schon 1000 mal gesehen hat und von denen ich deswegen hier keine weiteren Beispiele zeigen möchte ;-)

Darüber hinaus werden häufig Statistiken einfach in Form Tabellen dargelegt. Das ist wichtig und richtig, da eine Tabelle keinerlei Verfälschungen der Daten oder irgendwelche Ungenauigkeiten erzeugt. Das Problem ist allerdings meiner Meinung nach, dass Statistiken auch für die „breite Masse“ sehr interessant sein könnten; hier sage ich deswegen könnten, da sich vermutlich die wenigsten nach 12 stündigen Arbeitstagen abends auf ihr Sofa setzen um dann noch eine Statistik aus einer Tabelle mit 35 Zeilen und 27 Spalten auf irgendwelche Zusammenhänge zu durchforsten.

Und das kann ihnen niemand übel nehmen.

Aber wie ich festgestellt habe, bietet Circos die Möglichkeit sehr einfach automatisch aus Graphen und/oder Tabellen sehr coole (bildlich ansprechende) Diagramme zu erzeugen und dabei muss der Benutzer definitiv kein Grafiker oder Designer sein (Anmerkung: Grafiken die „von Hand“ durch solche Personengruppen erzeugt werden, sind natürlich in der Regel noch etwas wertvoller, da sie einfach individueller und durchdachter sind). Man kann, grob ausgedrückt, die Daten im Prinzip direkt als eine, auf eine bestimmte Art und Weise sortierte, csv Datei in Circos werfen und der Rest wird von der Anwendung erledigt.

Aber kommen wir mal zu einem Beispiel:

Circos Visualisierung

Ich habe hier eine Circos Visualisierung von einem co-authorship Graphen, der die höchsten 35 co-authorships im Zeitraum von 2006 – 2012 zeigt. Zudem bildet der orange Ring die ‚degree centrality‘ ab (als relativen Wert) und das blaue Histogramm zeigt die Anzahl von co-authorships pro Jahr (als absoluten Wert). D.h., um noch mal auf mein Argument mit der Statistik zurückzukommen, reden wir an dieser Stelle über eine Datenmatrix mit 35 × 35 Einträgen (für die Verbindungen) plus Tabellen, die die anderen Ringe abbilden. Wenn man sich das vor Augen führt, finde ich es schon ziemlich beeindruckend, wie viele Informationen man in diese eine Grafik einfügen kann; obwohl sie einigermaßen übersichtlich bleibt (vielleicht mit etwas Übung, wie die Grafik zu lesen ist).

Eine solche Grafik ließe sich auch publizieren und es bestünde zumindest die Chance, dass Leute außerhalb von rein wissenschaftlichen Kreisen sich diese einmal ansehen. Bei der Datenmatrix und den Tabellen würde ich diese Chance leider nicht sehen. So gesehen ist es sicherlich kein Zufall, dass die Wired im vorletzten Jahr Circos nutzte um eine große Grafik zu erzeugen, die die Beziehungen aller Charaktere aus Lost zueinander zeigte.

 

Um den Text also noch einmal in einem Satz zusammenzufassen:

Passende und intuitive Datenvisualisierung ist meiner Meinung nach wichtig und Circos hilft einem massiv bei der Erzeugung von eben solchen Diagrammen.

2 Antworten to “GEXF Vizz – Warum Diagramme nicht langweilig sein sollten”

  1. Dokunetzer 2. September 2012 um 14:49 #

    Ich finde die Idee ganz interessant, alleine wäre ich wohl nie auf das Tool gestoßen da ich nicht aus dem naturwissenschaftlichen Bereich komme.. Vielen Dank dafür ;) Habs auch gleich mal auf meinem Blog weitergeleitet und bin mir sicher das sich noch einige Interessenten finden werden.

    LG der Dokunetzer

Trackbacks/Pingbacks

  1. Diagramme in Latex mit pgfplots « Studentenblogs DDI@UPB - 5. August 2012

    […] unterschiedlich konfigurierten Systemen darstellen. Bisher erscheinen mir Darstellungen, wie sie im letzten Blogbeitrag genannte werden weniger Sinnvoll für meine […]

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: