Big-Data-Trends im Überblick

Was ist was bei Predictive Analytics?

18.05.2015 von Jürgen Mauerer
Predictive Analytics ist derzeit einer der wichtigsten Big-Data-Trends. Doch worin unterscheidet sich Predictive Analytics von Business Intelligence oder Business Analytics? Ist Data Mining mit Predictive Analytics identisch? Wir beantworten diese Fragen und klären die Begriffe.

Der Science Fiction-Thriller "Minority Report" zeigt eine Methode, mit der auch die deutsche Polizei künftig auf Verbrecherjagd gehen will: Predictive Policing, die Vorhersage von Straftaten. Software berechnet anhand von Tatmustern der vergangenen Jahre (Ort, Tatzeit, Art und Weise) beispielsweise die Wahrscheinlichkeit, mit der in einer bestimmten Region ein Einbruch geschehen wird. Die Polizei könnte dann Streifenwagen in der als gefährdet eingestuften Gegend konzentrieren.

Predictive Policing ist eine Form von Predictive Analytics. Es geht darum, auf Basis von Datenmodellen Voraussagen darüber zu treffen, wie sich eine Situation in Zukunft entwickeln wird oder kann. Auch Unternehmen wollen komplexe wirtschaftliche Zusammenhänge vorhersagen können, um bessere Entscheidungen zu treffen und sich einen Wettbewerbsvorteil zu verschaffen.

Doch was bedeutet Predictive Analytics konkret? Der Begriff fällt häufig im Kontext von Business Intelligence, Business Analytics und Data Mining. Weitere Schlagwörter wie Descriptive oder Prescriptive Analytics stiften zusätzliche Verwirrung.

Übergeordnet: Business Intelligence und Business Analytics

Predictive Analytics ist eine Teilmenge von Business Intelligence (BI) und Business Analytics (BA). BI und BA werden oft synonym verwendet, obwohl es Unterschiede bei Fragestellung und Methodik gibt. Im Prinzip stellt Business Analytics eine fortschrittlichere Evolutionsstufe von BI dar. Business Intelligence wird aber oft als Oberbegriff für alle Formen der Datenanalyse im Unternehmen verwendet.

Mit Business Intelligence (BI) sind Unternehmen in der Lage, Fragen zur aktuellen wirtschaftlichen Situation zu beantworten, indem sie Unternehmensdaten systematisch sammeln, auswerten und darstellen. Kennzahlen und Auswertungen zum Monats- oder Quartalsende unterstützen in Kombination mit Soll-Ist-Vergleichen das Management dabei, bessere operative oder strategische Entscheidungen zu treffen.

BI befasst sich überwiegend mit den Geschehnissen in der Vergangenheit und deren Auswirkungen auf die Gegenwart. Es beantwortet Fragen zum Geschehen (Was ist wann passiert?), zur Menge, Häufigkeit oder den Ursachen eines Ereignisses. Werkzeuge dafür sind beispielsweise Reporting (KPIs, Metriken), automatisiertes Monitoring (Alarm bei Über-/Unterschreiten von Schwellenwerten), Dashboards, Ad-hoc-Anfragen oder OLAP (Online Analytical Processing). OLAP beispielsweise arbeitet deduktiv, stellt also Hypothesen auf und fragt gezielt Informationen ab, um die Vorannahme zu bestätigen oder zu verwerfen.

Predictive Analytics als Teildisziplin von Business Analytics

Predictive Analytics bildet eine Teildisziplin von Business Analytics. Sie setzt da an, wo OLAP oder Reporting aufhören.
Foto: vetkit - shutterstock.com

Business Analytics erweitert BI um den Blick in die Zukunft und setzt vor allem auf statistische Analysen von Unternehmensdaten. Business Analytics gibt Antworten auf die Fragen nach den Gründen, Auswirkungen, Wechselwirkungen oder Folgen von Ereignissen. Zudem ist es möglich, Szenarien durchzuspielen und Handlungsalternativen aufzuzeigen: Was geschieht, wenn wir an dieser oder jener Stellschraube drehen?

Um den Planungsprozess im Unternehmen zu verbessern, nutzt Business Analytics diverse Analyse-Tools. Hier die wichtigsten Anwendungen von Business Analytics inklusive Methode:

• A/B-Tests oder multivariates Testen mit mehreren Variablen, um Entscheidungen zu überprüfen.

• Statistische oder quantitative Analyse, um zu erklären, warum ein bestimmtes Ergebnis eingetreten ist.

• Entdeckung von neuen Mustern und Zusammenhängen in Daten (Data Mining). Im Gegensatz etwa zu OLAP ist diese Analysetechnik induktiv, das heißt sie sucht in den Datensätzen ohne eine Vorannahme nach Auffälligkeiten oder Mustern, interpretiert diese und stellt eigene Hypothesen auf.

• Vorhersage künftiger Ergebnisse, sprich Predictive Analytics.

Predictive Analytics bildet damit eine Teildisziplin von Business Analytics. Sie setzt da an, wo OLAP oder Reporting aufhören. Statt nur die bestehende Situation zu analysieren, versucht Predictive Analytics mithilfe von Datenmodellen, Vorhersagen über mögliche Ereignisse in der Zukunft zu treffen. Dabei besteht eine enge Verbindung mit Data Mining.

Data Mining: enge Verbindung mit Predictive Analytics

Noch halten sich die Unternehmen mit Investitionen zurück.

Häufig werden Data Mining und Predictive Analytics sogar synonym gebraucht. In der Tat spielen Methoden und Werkzeuge des Data Mining eine wesentliche Rolle in Predictive-Analytics-Lösungen; Predictive Analytics geht aber noch über Data Mining hinaus und nutzt weitere Methoden wie maschinelles Lernen, Elemente der Spieltheorie oder Simulationsverfahren. Predictive Analytics nutzt zudem Text-Mining, auf Algorithmen basierende Analyseverfahren, um aus nichtstrukturierten Textdaten (Artikel, Blogs, Tweets, Facebook-Inhalte etc.) Strukturen herauszufinden.

Was ist Data Mining? Data Mining (deutsch "Daten schürfen") versucht, mithilfe anspruchsvoller statistischer und mathematischer Verfahren beziehungsweise Algorithmen verborgene Muster, Trends und Zusammenhänge in großen Datenmengen zu erkennen. Zu den klassischen Data-Mining-Methoden gehören beispielsweise

• Clustering: Hier geht es darum, Daten zu segmentieren und verschiedene Gruppen zu bilden (etwa Kunden nach Einkommensstufen).

• Klassifizierung: Hier sind die Gruppen/Klassen bereits vorgegeben. Datenelemente werden automatisch den verschiedenen Klassen zugeordnet (beispielsweise umsatzstarke und umsatzschwache Filialen). Zur Klassifikation gehört auch die Entscheidungsbaumanalyse.

• Regressionsanalyse: Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen werden identifiziert (zum Beispiel: Produktabsatz hängt von Produktpreis und Einkommen der Kunden ab).

• Assoziationsanalyse: Suche nach Mustern, bei denen ein Ereignis mit einem anderen Ereignis verbunden ist; die Abhängigkeiten zwischen den Datensätzen werden über Wenn-dann-Regeln beschrieben (etwa, wenn ein Kunde Cola kauft, kauft er auch Salzstangen).

Data Mining nutzt auch neuronale Netze, die der Arbeitsweise des menschlichen Gehirns ähneln und über viele Datendurchläufe bestehende Strukturen oder Muster lernen. Daher ist Data Mining eng verwandt mit maschinellem Lernen, sprich Anwendungen und Methoden, in denen Computerprogramme selbstständig neues Wissen erwerben. Während aber beim Data Mining der Fokus auf dem Finden neuer Muster liegt, die bereits in den bestehenden Daten vorliegen, geht es beim maschinellen Lernen darum, neue Berechnungsfunktionen aus vorhandenen Daten abzuleiten. Hier werden die Algorithmen so trainiert, dass sie aus den vorliegenden Daten lernen, selbstständig ein Datenmodell erzeugen und dieses für Prognosen oder Entscheidungen einsetzen. Beispiel: Eine Versicherung erzeugt mithilfe von historischen Kündigungsdaten ein Modell, das Kunden vorhersagt, die künftig ebenfalls kündigen könnten.

Wie unterscheiden sich Predictive und Prescriptive Analytics?

Gartner definiert vier Analytics-Spielarten
Foto: Gartner

Einen weiteren Orientierungspunkt für die Einordnung von Predictive Analytics bietet das Analytics-Reifegradmodell von Gartner. Gartner unterscheidet hier vier Stufen:

Descriptive Analytics: Was ist passiert? Descriptive Analytics beschäftigt sich mit der Vergangenheit und versucht, Auswirkungen auf die Gegenwart zu verstehen (siehe Business Intelligence).

Diagnostic Analytics: Warum ist etwas passiert? Diagnostic Analytics gibt Antworten auf die Fragen nach den Gründen, Auswirkungen, Wechselwirkungen oder Folgen von Ereignissen. Hier würde der Begriff Business Analytics gut passen (siehe oben).

Predictive Analytics: Was wird passieren? Predictive Analytics blickt in die Zukunft und liefert auf Basis von Data Mining, maschinellem Lernen und anderen statistischen Methoden Vorhersagen über die Wahrscheinlichkeit von künftigen Ereignissen.

Prescriptive Analytics: Wie müssen wir handeln, damit ein künftiges Ereignis (nicht) eintritt? Prescriptive Analytics geht noch einen Schritt weiter als Predictive Analytics. Es liefert zusätzlich Handlungsempfehlungen, wie man einen bestimmten Trend in eine gewünschte Richtung beeinflussen, ein vorhergesagtes Ereignis verhindern oder auf ein künftiges Ereignis reagieren kann. Basis sind anspruchsvolle analytische Modelle und Monte-Carlo-Simulationen, die mit bekannten und zufälligen Variablen ausgeführt werden, um die nächsten Aktionen zu empfehlen, Wenn-dann-Szenarien anzuzeigen oder die Bandbreite möglicher Ergebnisse besser verstehen zu können.

Welche Anwendungsszenarien für Predictive Analytics gibt es?

Predictive Analytics wird mittlerweile in vielen Branchen mit großem Erfolg eingesetzt, nicht nur im Sicherheitsbereich (siehe Predictive Policing). Das intelligente Stromnetz (Smart Grid) der Zukunft beispielsweise stellt Lastprognosen auf und sagt den Strombedarf voraus, um den Stromverbrauch und die fluktuierende Stromerzeugung (Solar- und Windkraftwerke) in Einklang zu bringen. Banken schätzen beim Kredit-Scoring die Wahrscheinlichkeit oder das Risiko ab, mit der/dem ein Kunde die künftigen Ratenzahlungen eines gewährten Kredits nicht leisten könnte.

Ein Beispiel aus der Industrie ist Predictive Maintenance, sprich vorausschauende Wartung. Sensoren übermitteln dabei Daten zum Status etwa einer Anlage wie Leistung, Temperatur, Umdrehungen und Auslastung an eine Cloud-Plattform. Die Lösung analysiert Kenndaten bezüglich Nutzung, Verschleiß und Zustand aus verschiedenen Quellen und erkennt so Fehlermuster und qualitativ minderwertige Komponenten. Der Service kann rechtzeitig reagieren und einen kostspieligen Ausfall der Maschine proaktiv verhindern, indem er beispielsweise ein neues Ersatzteil einbaut oder die Wartungsarbeiten vorzieht. Webshops analysieren das bisherige Kaufverhalten eines Kunden und schlagen ihm weitere Produkte vor.

Es gibt unzählige Beispiele für Predictive Analytics. Grundsätzlich gilt: Predictive Analytics ist ein kontinuierlicher, iterativer Prozess. Da sich die eingesetzten Modelle durch den fortschreitenden Einsatz immer weiter verbessern und anpassen, werden auch die Vorhersagen immer präziser.