Bei Big Data geht es nicht (nur) um Daten

Bei Big Data geht es nicht (nur) um Daten

Mit Big Data lässt sich alles belegen oder gar beweisen. Dieser Eindruck kann bei einem Blick auf die nahezu unendlichen Einsatzgebiete von Datenanalysen leicht entstehen. Nach dem Motto „mehr ist besser“ wird beispielsweise unterstellt, dass der Erkenntnisgewinn mit der Menge der analysierten Daten wächst – Korrelationen sind besser ausgeprägt und Muster deutlicher zu erkennen. Und wenn ein Unternehmen die kennt, wissen die Entscheider im Marketing, Vertrieb oder Customer Service genau, was zu tun ist.

So weit so gut. Was aber, wenn die Grundannahmen über die vermeintlichen Zusammenhänge nicht stimmen? An einem einfachen Fall lässt sich das leicht illustrieren: dem angeblichen Zusammenhang zwischen der Zahl der Geburten und der Anzahl der Störche in einer bestimmten Region. An Zahlen dafür mangelt es nicht, aber das zeitliche Zusammentreffen ist kein Beweis für einen kausalen Zusammenhang. Nicht die Störche sind die Ursache für eine höhere Geburtenrate, sondern der Grad der Urbanisierung. Auf dem Land gibt es mehr Störche und die Geburtenrate, gemessen an der Einwohnerzahl, ist höher als in der Stadt, wo weniger Kinder geboren werden. In die gleiche Richtung geht die beliebte Aufgabe aus dem Grundkurs empirische Sozialforschung: Berechnen Sie die Korrelation zwischen dem Konsum von Eiscreme und der Zahl der bei Badeunfällen Ertrunkenen. Zahlengläubige lassen sich sehr schnell aufs Glatteis führen.

Der entscheidende Punkt hier: Ein (vielleicht zufälliges) Muster liefert noch keinen Ursache-Wirkungs-Zusammenhang, geschweige denn eine Handlungsanleitung. Nicht nur für Big Data gilt: Vorsicht vor den Fallstricken der Denkfigur aus der klassischen Logik „cum hoc ergo propter hoc“ (auf Deutsch: Es tritt zusammen auf, also hat es etwas miteinander zu tun).

Zu viel Zahlengläubigkeit ist fast immer der falsche Weg. Big Data ist nicht die neue Business-Religion oder ein magisches Werkzeug, das ohne eigenes Zutun und vor allem ein kritisches Hinterfragen automatisch den richtigen Weg weist. Big Data kommt ohne Intuition und die Prüfung alternativer Erklärungsmuster nicht aus. Gute Argumente dafür finden sich in einem Beitrag von Tim Leberecht für CNN: Why Big Data will never beat business intuition.