Tipps und Tricks

10 Dinge, die Sie über Big Data wissen sollten

Wer das Thema Big Data im Unternehmen erfolgreich umsetzen will, sollte hinsichtlich Vorgehensweise und Tools einige Punkte beachten.

Wir haben im Folgenden einige Aspekte zusammengefasst, die Verantwortliche berücksichtigen sollten, wenn das Thema Big Data im Unternehmen angegangen werden soll.

Tipps für Big-Data-Projekte

Unternehmen sollten sich im Klaren sein, welche Daten sie erfassen und welche Ergebnisse sie erzielen wollen. Für Big Data sollten möglichst viele bis alle Daten erfasst werden können. Im Gegensatz zu BI-Lösungen sollten sich Verantwortliche nicht in Nebensächlichkeiten verstricken, sondern immer das große Ganze sehen.

Sehr wichtig, vor allem bei der Verarbeitung von Daten aus sozialen Netzwerken, ist der Datenschutz. Hier sollten Entwickler und Verantwortliche sehr sensibel vorgehen, aber nicht gleich ganze Datensammlungen ausklammern. Gesammelt und verarbeitet sollten aber nur Daten werden, die den Zielen des Big-Data-Projektes entsprechen.

Die Hardware und die Big-Data-Lösung sollten nicht nur erste Daten zuverlässig verarbeiten können, sondern als skalierbare Lösung mit den Daten mitwachsen können. Am besten geeignet sind dazu sicher Cloud-Lösungen bekannter Hersteller wie Microsoft, Amazon oder Google.

Benutzerschnittstelle berücksichtigen: Wichtig ist, dass die Anwender im Unternehmen etwas mit den Daten anfangen und diese selbstständig auslesen und analysieren können. Die Daten sollten von überall zugreifbar sein, durchaus auch mobil.

Big-Data-Leitfaden

Der Branchenverband BITKOM bietet eine kostenlose PDF-Datei, die als Leitfaden für Big-Data-Projekte verwendet werden kann. Unternehmen sollten sich den Leitfaden ansehen, bevor sie sich entschließen, ein erstes Big- Data-Projekt in Angriff zu nehmen.

Big Data mit Microsoft Azure

Um Big Data im Unternehmen einzusetzen, können Sie mit HDInsight einen Hadoop-Cluster in Microsoft Azure erstellen. Auf diesen Cluster können Sie mit herkömmlichen Microsoft-Mitteln wie C#, PowerShell oder Visual Studio zugreifen. Auch mit der PowerShell können Sie den Dienst steuern und sogar MapReduce-Abfragen durchführen.

Mit dem Azure SDK und den Azure Tools lassen sich HDInsight-Cluster mit HDInsight Tools für Visual Studio steuern und Abfragen erstellen. Damit verwalten Sie nicht nur den Speicher, sondern erstellen auch Hive-Abfragen und überwachen Hive-Jobs.

Hadoop-Cloud-Lösung offline testen

Um sich mit Hadoop und Big Data zu beschäftigen, ist HDInsight der schnellste Weg. Microsoft stellt für Entwickler eine Offline-Testumgebung für HDInsight zur Verfügung. Mit der Umgebung bauen Sie schnell und einfach eine Offline-Umgebung auf, können für Big Data entwickeln und die Daten dann in die Cloud hochladen.