Grundlagenserie Business Intelligence

BI-Methoden (Teil 2): Data Mining Phasen und Vorgehensschritte

Mit Data Mining soll verborgenes, wirtschaftlich nutzbares Wissen in großen Datenbasen entdeckt werden. Dies erfolgt in einem mehrphasigen Prozess. Die wichtigsten Schritte stellen wir Ihnen vor.

Data Mining hat das Ziel, neuartiges, verstecktes Wissen aus großen Datenbeständen zu extrahieren. Dabei sollen Beziehungsmuster wie Regelmäßigkeiten oder Auffälligkeiten in umfangreichen Datenbeständen ermittelt und nutzbar gemacht werden.

Diese Beziehungsmuster sollten für einen möglichst großen Anteil der Datenbasis Geltung haben. Und sie sollten bis dato unbekannte, leicht verständliche Zusammenhänge in den Daten zu Tage fördern, die nicht trivial sind. Hinter der Forderung nach Nichttrivialität der Ergebnisse verbirgt sich der Anspruch, dass gefundene Lösungen auch tatsächlich neues Wissen produzieren und Entdeckungen im engeren Sinne darstellen sollen.

Ziel beim Data Mining ist es also nicht, einzelne Daten aufzulisten oder zu aggregieren. Vielmehr wird immer angestrebt, allgemeine Zusammenhänge zu entdecken und dafür ein Modell zu erstellen. Die im Datenbestand induktiv ermittelten und in Form eines Modells zum Ausdruck gebrachten Zusammenhänge entsprechen dabei den Hypothesen über den durch die Daten abgebildeten Gegenstandsbereich.

Beispielsweise kann Data Mining bei der Analyse der Kundendaten eines Telekommunikationsunternehmens die Hypothese generieren: „Kunden unter 35 Jahren mit einem Vieltelefonierer-Tarif gehören in 80 Prozent der Fälle zu den umsatzstärksten Kunden“.