Big-Data-Trends im Überblick

Was ist was bei Predictive Analytics?

Data Mining: Enge Verbindung mit Predictive Analytics

Häufig werden Data Mining und Predictive Analytics sogar synonym gebraucht. In der Tat spielen Methoden und Werkzeuge des Data Mining eine wesentliche Rolle in Predictive-Analytics-Lösungen; Predictive Analytics geht aber noch über Data Mining hinaus und nutzt weitere Methoden wie maschinelles Lernen, Elemente der Spieltheorie oder Simulationsverfahren. Predictive Analytics nutzt zudem Text-Mining, auf Algorithmen basierende Analyseverfahren, um aus nichtstrukturierten Textdaten (Artikel, Blogs, Tweets, Facebook-Inhalte etc.) Strukturen herauszufinden.

Noch halten sich die Unternehmen mit Investitionen zurück.
Noch halten sich die Unternehmen mit Investitionen zurück.

Was ist Data Mining? Data Mining (deutsch "Daten schürfen") versucht, mit Hilfe anspruchsvoller statistischer und mathematischer Verfahren beziehungsweise Algorithmen verborgene Muster, Trends und Zusammenhänge in großen Datenmengen zu erkennen. Zu den klassischen Data-Mining-Methoden gehören beispielsweise

• Clustering: Hier geht es darum, Daten zu segmentieren und verschiedene Gruppen zu bilden (etwa Kunden nach Einkommensstufen)

• Klassifizierung: Hier sind die Gruppen/Klassen bereits vorgegeben. Daten-Elemente werden automatisch den verschiedenen Klassen zugeordnet (beispielsweise umsatzstarke und umsatzschwache Filialen). Zur Klassifikation gehört auch die Entscheidungsbaumanalyse.

• Regressionsanalyse: Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen werden identifiziert (zum Beispiel: Produktabsatz hängt von Produktpreis und Einkommen der Kunden ab).

• Assoziations-Analyse: Suche nach Mustern, bei denen ein Ereignis mit einem anderen Ereignis verbunden ist; die Abhängigkeiten zwischen den Datensätzen werden über Wenn-dann-Regeln beschrieben (etwa, wenn ein Kunde Cola kauft, kauft er auch Salzstangen).

Data Mining nutzt auch neuronale Netze, die der Arbeitsweise des menschlichen Gehirns ähneln und über viele Datendurchläufe bestehende Strukturen oder Muster lernen. Daher ist Data Mining eng verwandt mit maschinellem Lernen, sprich Anwendungen und Methoden, in denen Computerprogramme selbstständig neues Wissen erwerben. Während aber beim Data Mining der Fokus auf dem Finden neuer Muster liegt, die bereits in den bestehenden Daten vorliegen, geht es beim maschinellen Lernen darum, neue Berechnungsfunktionen aus vorhandenen Daten abzuleiten. Hier werden die Algorithmen so trainiert, dass sie aus den vorliegenden Daten lernen, selbstständig ein Datenmodell erzeugen und dieses für Prognosen oder Entscheidungen einsetzen. Beispiel: Eine Versicherung erzeugt mit Hilfe von historischen Kündigungsdaten ein Modell, das Kunden vorhersagt, die künftig ebenfalls kündigen könnten.

Wie unterscheiden sich Predictive und Prescriptive Analytics?

Gartner definiert vier Analytics-Spielarten
Gartner definiert vier Analytics-Spielarten
Foto: Gartner

Einen weiteren Orientierungspunkt für die Einordnung von Predictive Analytics bietet das Analytics-Reifegradmodell von Gartner. Gartner unterscheidet hier vier Stufen:

Descriptive Analytics: Was ist passiert? Descriptive Analytics beschäftigt sich mit der Vergangenheit und versucht, Auswirkungen auf die Gegenwart zu verstehen (siehe Business Intelligence).

Diagnostic Analytics: Warum ist etwas passiert? Diagnostic Analytics gibt Antworten auf die Fragen nach den Gründen, Auswirkungen, Wechselwirkungen oder Folgen von Ereignissen. Hier würde der Begriff Business Analytics gut passen.

Predictive Analytics: Was wird passieren? Predictive Analytics blickt in die Zukunft und liefert auf Basis von Data Mining, maschinellem Lernen und anderen statistischen Methoden Vorhersagen über die Wahrscheinlichkeit von zukünftigen Ereignissen.

Prescriptive Analytics: Wie müssen wir handeln, damit ein zukünftiges Ereignis (nicht) eintritt? Prescriptive Analytics geht noch einen Schritt weiter als Predictive Analytics. Es liefert zusätzlich Handlungsempfehlungen, wie man einen bestimmten Trend in eine gewünschte Richtung beeinflussen, ein vorhergesagtes Ereignis verhindern oder auf ein zukünftiges Ereignis reagieren kann. Basis sind anspruchsvolle analytische Modelle und Monte-Carlo-Simulationen, die mit bekannten und zufälligen Variablen ausgeführt werden, um die nächsten Aktionen zu empfehlen, Wenn/Dann-Szenarien anzuzeigen oder die Bandbreite möglicher Ergebnisse besser verstehen zu können.

Welche Anwendungsszenarien für Predictive Analytics gibt es?

Predictive Analytics wird mittlerweile in vielen Branchen mit großem Erfolg eingesetzt, nicht nur im Sicherheits-Bereich (siehe Predictive Policing). Das intelligente Stromnetz (Smart Grid) der Zukunft beispielsweise stellt Lastprognosen und sagt den Strombedarf voraus, um den Stromverbrauch und die fluktuierende Stromerzeugung (Solar- und Windkraftwerke) in Einklang zu bringen. Banken schätzen beim Kredit-Scoring die Wahrscheinlichkeit oder das Risiko ab, mit der/dem ein Kunde die zukünftigen Ratenzahlungen eines gewährten Kredits nicht leisten könnte.

Ein Beispiel aus der Industrie ist Predictive Maintenance, sprich vorausschauende Wartung. Sensoren übermitteln dabei Daten zum Status etwa einer Anlage wie Leistung, Temperatur, Umdrehungen und Auslastung an eine Cloud-Plattform. Die Lösung analysiert Kenndaten bezüglich Nutzung, Verschleiß und Zustand aus verschiedenen Quellen und erkennt so Fehlermuster und qualitativ minderwertige Komponenten. Der Service kann rechtzeitig reagieren und einen kostspieligen Ausfall der Maschine proaktiv verhindern, indem er beispielsweise ein neues Ersatzteil einbaut oder die Wartungsarbeiten vorzieht. Webshops analysieren das bisherige Kaufverhalten eines Kunden und schlagen ihm weitere Produkte vor.

Es gibt unzählige Beispiele für Predictive Analytics. Grundsätzlich gilt: Predictive Analytics ist ein kontinuierlicher, iterativer Prozess. Da sich die eingesetzten Modelle durch den fortschreitenden Einsatz immer weiter verbessern und anpassen, werden auch die Vorhersagen immer präziser. (cvi)