Grundlagenserie Business Intelligence

BI-Methoden (Teil 3): Data Mining im Detail

Für das Aufspüren wirtschaftlich interessanter Muster und Zusammenhänge stehen eine ganze Reihe von Data Mining Verfahren zur Verfügung. Wir erläutern die Unterschiede zwischen Assoziationsanalyse, Clusteranalyse, Entscheidungsbaumanalyse, Neuronalem Netz und Regressionsmodell.

Data Mining im engeren Sinn besteht aus einer Vielzahl von Methoden. Diese lassen sich für unterschiedlichste Ziele und Aufgaben einsetzen. Die Entscheidungsbaumanalyse kann beispielsweise zur Klassifikation von Kunden mit unterschiedlichen Kreditrisiken genutzt werden. Mit Regressionsverfahren lassen sich Absatzzahlen prognostizieren. Clustermethoden segmentieren Kunden automatisch in verschiedene Käufergruppen. Und die Assoziationsanalyse führt zur Entdeckung von Abhängigkeiten, etwa, dass Käsekäufer auch oft Rotwein in den Warenkorb legen.

Wie bereits im Artikel über Data Mining Phasen erwähnt, ist aber eine eineindeutige Zuordnung zwischen Data Mining Verfahren und bestimmten Aufgaben oder Analysezielen nicht möglich. Stattdessen können einzelne Aufgaben mit mehreren Methoden angegangen werden. So lässt sich ein Neuronales Netz ebenso wie die Entscheidungsbaumanalyse zur Erstellung eines Klassifikations- oder Clustermodells nutzen.

In diesem Beitrag werden die wichtigsten Data Mining Verfahren in einem Überblick vorgestellt. Auf technische und mathematisch-statistische Details der oft recht komplexen Methoden können wir leider nicht eingehen, hier muss auf die weiterführende Literatur verwiesen werden.