OLAP-Nutzung vereinfacht

Microsoft SQL Server 2008 R2 - optimierte BI-Funktionen und Performance-Tools

24.06.2010 von Thomas Steudten
Microsofts neue Datenbanklösung "SQL Server 2008 R2" unterstützt erweiterte Business-Intelligence-Funktionen. OLAP-optimiertes Power Pivot, der Report Builder und Performance-Tools erleichtern die BI-Funktionalität deutlich, wie unser Artikel erläutert.

Unter BI - einem Begriff aus den 1990ern - versteht man im Allgemeinen Methoden, Verfahren und Hilfsmittel, mit denen sich interne und externe Kenngrößen ermitteln lassen. Mit den Kenngrößen erfolgt beispielsweise eine Einordnung des eigenen Unternehmens im Vergleich zu den Mitbewerbern, oder es wird Potenzial für Kostensenkungen ermittelt. Den analytischen Informationssystemen kommt dabei mit Data Mining und "Online Analytical Processing" (OLAP) eine besondere Bedeutung zu. Die wirtschaftliche Situation des eigenen Unternehmens wird mit den Daten aus bereits vorhandenen Informationsquellen (ERP-Systeme) aus unterschiedlichen Blickwinkeln betrachtet, und mithilfe von Data Mining werden Korrelationen ermittelt. Die eigentliche Analyse aller gesammelten Daten findet dann in der Regel im Data Warehouse (DWH) statt, das üblicherweise stark volumenorientiert ausgerichtet wird.

Adressaten der so gewonnenen Informationen sind Entscheidungsträger wie die Geschäftsführung und strategisch fokussierte Abteilungen, beispielsweise Marketing und Finanzwesen. Aber auch der Verkauf kann von den Informationen profitieren, wenn die Ergebnisse passend aufbereitet wurden - Stichwort "Informationsmanagement".

Demzufolge nicht es nicht wunder, dass die BI mindestens aus zwei Funktionsblöcken realisiert wird:

Hochperformante, skalierbare DB-Server wie Microsofts neuer SQL Server 2008 R2 mit zentraler Datenhaltung und vereinfachter Administration bilden hier die notwendige Infrastruktur.

Die Business Intelligence von Microsoft basiert auf drei Layern:

Der Benutzer am einen Ende kommt mit diesem Konstrukt primär über die Office Suite 2010 mittels Excel in Berührung. "Self-Service" sagt Microsoft dazu und meint, dass der Benutzer nicht mehr so intensiv auf Spezialisten aus dem IT-Bereich angewiesen sein soll, um Reports und Auswertungen zu erstellen. Microsofts SQL Server 2008 R2 bietet als BI-Plattform somit Services, die einerseits durch Anwender genutzt werden können (DWH, Analysis-, Reporting), andererseits aber auch dem Administrator die Wartung erleichtert. Dazwischen sieht Microsoft SharePoint 2010, das eine Publikation der Ergebnisse und eine gemeinsame Nutzung ermöglicht.

Im Unternehmen steht somit rein technisch eine optimale Lösung für OLTP-, OLAP- oder DWH-Anwendungen zur Verfügung.

Optimiert für OLAP

Die Auswahl der Datenquellen, der Daten selbst und der Funktionen für die Verarbeitung sowie die Visualisierung der Daten finden im ersten Layer statt und sind damit die Schnittstelle zum Anwender.

Bereits der SQL Server 2008 bot neue Diagrammtypen, schnelle Web-Reports und leistungsfähige Analysemethoden mit verbesserten Cube-Design-Werkzeugen. Die "Tablix"-Datenstruktur (Tabelle, Matrix, Liste) wurde mit dem SQL Server 2008 R2 neu eingeführt. Insgesamt verbesserte sich auch die Integration mit Office 2007. Für Tabellen wurde die Partitionierung ermöglicht.

PowerPivot im SQL Server 2008 R2 erfordert dagegen bereits den Office-Nachfolger 2010 und ist optimiert für OLAP. Die Rückschreibelösung des bisherigen SQL Server 2008 beherrscht nur relationales OLAP (ROLAP). Mit R2 kommt nun auch das multidimensionale OLAP (MOLAP) in Frage, was einen schnellen Zugriff auf die Daten-Cubes ermöglicht. Hybrides OLAP (HOLAP) als Mischform zwischen ROLAP und MOLAP wird genauso wenig unterstützt wie die Architekturform Desktop OLAP (DOLAP) und Spatial OLAP (SOLAP), Realtime OLAP (RTOLAP) oder webbasiertes OLAP (WOLAP), die eher Spezial- und Mischfälle darstellen.

Eingeklinkt: Mit dem PowerPivot Plugin für Excel2010 kommt ein weiterer Tab hinzu. (Quelle: Microsoft)

Zwar skaliert ROLAP besser, und der Speicherbedarf ist geringer, weil die Analysedaten immer neu bezogen werden, dafür ist es im Mittel aber langsamer als MOLAP. Das persistente Speichern von bereits ermittelten Ergebnissen benötigt viel Platz; dafür ist der Zugriff darauf sehr schnell möglich, und natürlich wird keine erneute Berechnung benötigt. Der Neuaufbau der Daten-Cubes, elementares Element bei OLAP, dauert jedoch ebenso eine gewisse Zeit. Welche Form von OLAP angewendet wird, hängt also von der spezifischen Fragestellung ab, die sich der Analyst vor der Auswertung überlegt hat. MOLAP-Datensätze müssen nicht über Indizes gesucht werden, da ihre Positionen im Cube bekannt sind.

Daten im mehrdimensionalen Würfel passend auszuwerten und die Ergebnisse der Operationen verständlich zu visualisieren wird durch die Cube-Operationen erleichtert. Man kann beispielsweise Scheiben ausschneiden (Slicing), Teilwürfel generieren (Dicing = mehrfaches Slicing), die Ansicht des Würfels auf eine neue Dimension drehen (Pivoting) oder Hinein- und Hinauszoomen. Multidimensionale Expressions (MDX) sind speziell für die Datenabfrage von mehrdimensionalen Objekten - beispielsweise Cubes - und für das Zurückliefern von mehrdimensionalen Cellsets vorgesehen.

Das Handling der generierten Reports, das Einbinden von Binärdaten (Large Binary Objects LOB) und eine mögliche Suchfunktion werden unter "Collaboration" auf der SharePoint-Ebene abgebildet. Die Excel-Services entsprechen der Funktionalität der Excel-Applikation auf Webbasis. Dazu zählen auch das Content-Management und die Dashboards respektive die Scorecards.

Zusammenfassend lässt sich also sagen, das es nicht ausreicht, nur eine optimierte BI-Plattform zu betreiben. Vielmehr muss das Interface auch von weniger spezialisierten Entscheidungsträgern bedient werden können. Eine Prozessunterstützung erhalten Entwickler durch die Entwicklungsumgebung "SQL Server Business Intelligence Development Studio", und das Optimieren der OLAP-Performance erleichtert der "Aggregations Designer".

Report Builder 3.0

Der Report Builder macht in R2 einen Versionssprung von 2.0 auf Version 3.0. Dieser enthält einen grafischen Abfrage-Designer für MDX-Abfragen für eine Microsoft-SQL-Server-Analysis-Services-Datenquelle. Damit ist das Erstellen der multidimensionalen Selects zumindest einfacher geworden.

Verbessert: Der Report Builder in Version 3 erlaubt in einfachen Schritten das Erstellen von Berichten. (Quelle: Microsoft)

Über den Reporting Services Configuration Manager lassen sich ganz einfach die notwendigen Einstellungen für den Webzugriff auf die Reports erledigen. Nicht vernachlässigen darf man dabei jedoch die notwendigen Sicherheitsmaßnahmen zum Absichern von Webservices. Der Report-Builder erlaubt zum einen das Erstellen von leistungsfähigen Ad-hoc-Berichten und zum anderen von solchen mit beliebiger Struktur.

Vereinfacht: Der Reporting Services Configuration Manager erleichtert das Einrichten der Report-Freigabe im Web. (Quelle: Microsoft)

Die Bedienung von "Data Mining" findet direkt in Excel statt, und auch sonst ist die Interoperabilität zu Office 2010 verbessert worden.

Performance-Tools

Microsoft liefert für den SQL Server 2008 R2 unter der Rubrik "Performance Tools" den "Database Engine Tuning Advisor" und "SQL Server Profiler" mit.

Die Optimierung im "Tuning Advisor" adressiert vorwiegend die Design-Struktur (PDS) und somit die zwei Schwergewichte Index und Partitionierung. Ein optimierter und vor allem aktueller Index wirkt sich oft förderlich auf die Performance aus. Die Partitionierung hingegen erlaubt auch die Skalierung über mehrere Instanzen.

Spürbare Verbesserungen in der T-SQL- und MDX-Verarbeitung des SQL Servers 2008 R2 hat Microsoft scheinbar nicht implementiert. Erfolgversprechende Optimierungen lassen sich durch gezielten Einsatz von Indizes erreichen. T-SQL-Optimierung heißt auch immer, zuerst einen Blick auf die Applikation zu werfen. Eine Skalierung von Systemressourcen führt nur dann zu einer verbesserten Leistung, wenn alle Komponenten aufeinander abgestimmt sind.

Performance-Tool: Der "Database Engine Tuning Advisor" bietet zahlreiche Tuning-Einstellungen, darunter die zwei wesentlichen Ansätze Indexoptimierung und Partitionierung. (Quelle: Microsoft)

Mit dem Feature Pack für SQL Server 2008 R2 bietet Microsoft eine Sammlung eigenständiger Pakete, mit denen der Nutzen des R2 weiter erhöht werden kann. Nachträglich installieren kann man dann auch den "StreamInsight Event Flow Debugger", der bei der Optimierung der Event-Verarbeitung der Datenströme behilflich sein kann.

Auch beim Verarbeiten großer Datenmengen möchte man möglichst schnell ein Ergebnis erhalten, sei es als Grafik oder als Tabelle - zusammenfassend als Report bezeichnet. Nichts stört mehr, als wenn die Grafik auch bei kleinen Anpassungen ständig neu aufgebaut wird.

Mit StreamInsight hat Microsoft im SQL Server 2008 R2 die Verarbeitung für Stream-Daten optimiert. Streams sind kontinuierliche Datenströme, wie sie beispielsweise bei Prozessdaten oder im Finanzsegment anfallen.

Fazit

Die Microsoft Business Intelligence Platform mittels SQL Server 2008 R2 bietet interessierten Unternehmen eine Plattform für die Verwaltung, Auswertung und Visualisierung von Daten. Auch erfahrene Administratoren werden dank zahlreicher Wizards und Tools in ihrer täglichen Arbeit entlastet.

Den OLAP-Markt beherrscht Microsoft eindeutig vor IBM, SAP und Oracle. Der SQL Server 2008 R2 wird diese Position dank PowerPivot-, Data-Mining-Plugin und DWH weiter ausbauen können. Dies liegt vermutlich an der bekannten und einfach strukturierten Bedienung mit Microsoft Office.

Viele OLAP-Nutzer schreckt die wenig verständliche Bedienung anderer Produkte eher ab, wie eine Umfrage zeigt. Es stechen jedoch auch zahlreiche nicht lizenzpflichtige BI-Lösungen im Open-Source-Umfeld hervor.

Weiterführende Informationen zu den BI-Features im SQL Server 2008 R2 finden Sie im SQL Server Techcenter und in der Online-Dokumentation. (cvi)