Big Data Analytics und NOSQL

Mehr Business Intelligence für alle

Nahtlose Integration und leistungsstarke Analysen

In jedem Unternehmen gibt es unterschiedlichste BI-Anwender. Manager benötigen in der Regel möglichst einfach gehaltene Dashboards, die Zusammenhänge und Trends auf einen Blick sichtbar machen. Business-Analysten wollen eigene Auswertungen erstellen, die bis zur untersten Belegebene reichen. Und mobile Mitarbeiter brauchen Informationen in knappen, Smartphone oder Tablet-tauglichen Formaten. Pentaho ist in der Lage, spezielle Fachbereichslösungen innerhalb einer gemeinsamen Plattform zu implementieren.

Eine NoSQL-Datenbank wie MongoDB mit den Big-Data-Analytics-Lösungen von Pentaho im Unternehmenseinsatz zusammenzubringen ist deshalb ein vielversprechender Ansatz. Die Kombination beider Technologien ermöglicht Anwendern, operative Unternehmensdaten durch echtzeitnahe Analyse und grafische Aufbereitung zu strategisch relevanten Kennzahlen zu veredeln. Pentaho greift direkt auf die von MongoDB bereitgestellten Funktionen und Inhalte wie das Aggregation Framework, die Tag Sets und die Replikationen zu. Das beschleunigt die Verfügbarkeit von Unternehmensdaten für alle Nutzergruppen.

Integration der Datenbank MongoDB in die Pentaho BA Suite.
Integration der Datenbank MongoDB in die Pentaho BA Suite.
Foto: it-novum GmbH

Direkte Datenverarbeitung aus MongoDB

Extraktions-, Transformations- und Ladeprozesse (ETL) sind die Grundschicht einer jeden Informationsarchitektur. Um Daten aus den unterschiedlichen Systemen in einer gemeinsamen Plattform zu integrieren, nutzt die Pentaho-BI-Suite das Pentaho-Data-Integration (PDI)-Modul. PDI ist ein grafisches ETL-Tool zum Extrahieren, Laden und Verarbeiten strukturiert und unstrukturiert vorgehaltener Daten. Mittels Data Blending und interaktiver Visualisierungen lassen sich deren Kodierung und Komplexität deutlich reduzieren. Das ermöglicht beispielsweise auch dem Marketing, Big-Data-Analyselösungen auf den Features von MongoDB aufzubauen.

Verknüpfung von Pentaho Data Integration (PDI) und MongoDB.
Verknüpfung von Pentaho Data Integration (PDI) und MongoDB.
Foto: it-novum GmbH

OLAP-Auswertung mit dem Pentaho Analyzer

Um relevante Daten und Kennzahlen in Beziehung zueinander zu setzen, nutzen sowohl klassische RDMBS als auch MongoDB die OLAP-Engine Mondrian. Die BI-Suite von Pentaho integriert mit dem Modul Pentaho Analyzer ebenfalls ein Tool zur Visualisierung und Auswertung von Daten, das direkt auf einem Mondrian-Schema aufsetzt. Mondrian unterstützt die Schnittstellen olap-4 und XML-A und eignet sich damit für die Einbettung in Drittapplikationen. Die vom Anwender gestellte Anfrage übersetzt Mondrian aus dem jeweiligen Frontend und aggregiert die zugehörigen Daten in einem OLAP-Würfel.

Die OLAP-Engine ist als Webanwendung in den Pentaho Analyzer integriert. Bis vor Kurzem war der Pentaho Analyzer nur in Verbindung mit relationalen Datenbanksystemen einsetzbar. Doch mit Version 5.1 der Pentaho-BA-Suite lassen sich Ad-hoc-Analysen, Dashboards und Reports auch direkt aus MongoDB erzeugen. Zusammen bieten beide Softwareumgebungen beispielsweise eine 360-Grad-Ansicht von Kunden, Lieferanten, Prozessen oder anderen relevanten Objekten im Unternehmen. (bw)