Grundlagenserie Business Intelligence

Business Intelligence (Teil 4): BI-Analysemethoden OLAP & Data Mining

Freie Recherche mit Datenbanksprachen

Im einfachsten Fall kann die Analyse der Daten über eine freie Datenrecherche mit einer Datenmanipulationssprache erfolgen. Dabei werden die in Data Warehouses und Data Marts abgelegten Daten direkt recherchiert und abgefragt.

Bei relationalen Datenbanken wird vorzugsweise SQL (Structured Query Language) eingesetzt. SQL erlaubt neben dem Lesen, Einfügen, Löschen und Ändern von Daten –für Analysezwecke wenig relevant– auch die gezielte Abfrage und Gruppierung von Daten.

Zum Beispiel selektiert der SQL-Befehl

SELECT Kfz, Einwohner, Name, Land FROM Stadt, stadt_in_land WHERE Einwohner >= 1000

aus den Input-Tabellen „stadt“ und „stadt_in_land“ die Namen aller Kfz-Besitzer, die in Orten mit mehr als 1000 Einwohner wohnen. Die Grafik zeigt, wie das Ergebnis der Abfrage genau zustande kommt.

Daten selektieren: Die SQL-Select-Anfrage mit abgeleiteten Tabellen und Ergebnistabelle.
Daten selektieren: Die SQL-Select-Anfrage mit abgeleiteten Tabellen und Ergebnistabelle.

Durch seine Rolle als Quasi-Standard ist SQL von großer Bedeutung, da die Sprache weitgehend unabhängig von der benutzten Software verwendet werden kann. Zudem hat SQL eine relativ einfache Syntax und ist semantisch an die englische Umgangssprache angelehnt.

Neben SQL nimmt im BI-Umfeld MDX (Multidimensional Expression) von Microsoft als Abfragesprache noch eine bedeutende Rolle ein, die sich als De-facto-Industriestandard in der Praxis ebenfalls etabliert hat.

Techniknahe Abfragesprachen im BI-Umfeld haben Vor- und Nachteile. Positiv ist die hohe Flexibilität und Performanz von Sprachen wie SQL, da die Operationen direkt im Datenbestand ausgeführt werden. Die Analysergebnisse lassen sich zudem leicht in anderen Systemumgebungen weiterverarbeiten.

Negativ macht sich bemerkbar, dass die Datenmanipulationssprachen einarbeitungsintensiv sind und hohe IT-Kompetenz voraussetzen. Manager und andere IT-Entscheider sind in der Regel nicht gewillt, sich dieses Wissen anzueignen, so dass SQL eher Datenbankadministratoren und Powerusern, allenfalls dem Low-Management, vorbehalten bleibt.