Vier neue Berufsbilder

Big Data Jobs: Wer macht was?

(Big) Data Scientist

Die Kernaufgabe des Data Scientists ist es, Antworten auf analytische Fragestellungen aus Daten zu generieren mit Hilfe von analytischen Methoden aus Bereichen der Statistik, des Machine Learnings oder Operations Research. Er wird zum Big Data Scientist, wenn er mit großen Datenmengen arbeitet und Erkenntnisse mit Hilfe von Analysemethoden generiert, die auf Big-Data-Technologien wie Hadoop aufbauen. Seine Aufgabe fängt mit dem Verständnis des fachlichen Problems an, geht über die Auswahl der benötigten Hilfsmittel wie Daten, Technologien und Methoden und mündet in eine Ideenfindungsphase.

Einen guten Data Scientist zeichnet vor allem das Repertoire dieses Baukasten und der schneller Griff zu den passenden Mitteln aus. Der Stereotyp des Data Scientist ist ein bärtiger, T-Shirt tragender Nerd, der aus wenigen Daten innerhalb kürzester Zeit mit Hilfe von frei verfügbaren Tools und Technologien geniale Erkenntnisse zieht und diese anschaulich visualisiert und erklärt. Er ist also der Spielmacher, der im entscheidenden Match den Unterschied machen kann. Der Data Scientist arbeitet in jeder Phase eng mit dem Data Engineer und dem Management Scientist zusammen, denn nur zusammen können sie die fachliche Aufgabenstellung lösen. Wenn der Data Scientist weniger Aufgaben des Data Engineers oder des Management Scientists übernehmen muss, hat er mehr Zeit für seine eigentlichen Aufgaben - genau wie im Profifußball auch die Spieler nicht selbst die Tore aufstellt oder die Linien auf dem Platz markiert. Aber je kleiner das Unternehmen ist, desto häufiger übernimmt der Data Scientist in der Regel auch die Aufgaben von Data Engineer und dem Management Scientist.

Auch früher gab es übrigens bereits Data Scientists. Sie hießen Data Miner, Datenanalysten oder waren in speziellen Rollen, die ihnen Titel wie Marketing Analyst, Aktuar oder Logistikplaner verliehen haben. Was sich geändert hat und in das neue Berufsbild des Data Scientists nun mit hineinspielt, ist eine Form von Kreativität und Cleverness. Der Data Scientist ist der Herr der Datenauswertung.

Data Steward

Der Data Steward ist eine Rolle, die auch gerne in diesem Zusammenhang fällt: Im Vergleich zu den anderen drei Berufsbildern hat er nicht unmittelbar etwas mit dem Spielgeschehen zu tun. Er ist für die Überwachung der Qualität und der fachlichen Korrektheit von Daten zuständig. Häufig teilt er sich die Aufgabe mit weiteren Data Stewards in Datenbereiche auf oder arbeitet mit Kollegen in der IT-Abteilung zusammen, die "Data Custodians" genannt werden. Die Datenbereiche gliedern sich nach fachlichen Entitäten, also beispielsweise nach Kunde, Produkt, Transaktionen, Zahlungen, Partnern oder Kampagnen.

Die Aufgaben des Data Stewards gehen von der Definition der Datenbereiche in seiner Hoheit, über die Definition von allgemeinen Regeln und Leitlinien zum Inhalt und zur Nutzung dieser Datenbereiche bis hin zur Prüfung der Einhaltung der geltenden Regeln. Mit den Standards, für deren Einhaltung er sorgt, sichert er die dauerhafte Qualität der Daten, ihrer Verarbeitung, ihrer Auswertung und letztendlich ihrer Nutzung zur operativen Steuerung und Entscheidungsfindung von Geschäftsprozessen. Böse Zungen behaupten, der Data Steward sei wie ein Funktionär beim Sport - man weiß nicht genau wofür, aber irgendwie braucht man ihn. (sh)