Big Data

Data Scientists - auf der Suche nach den Schätzen im Datenberg

Big Data

Die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, wird 2020 bei etwa 40 Zettabytes liegen. Das ist eine Zahl mit 21 Nullen. Innerhalb von zehn Jahren soll die Datenmenge dann um das 50-Fache gestiegen sein, schätzen Marktbeobachter von IDC und des Speichersystemherstellers EMC. Und es werden immer mehr: Alle zwei Jahre verdoppelt sich das Datenvolumen. Seit 2002 werden Daten häufiger digital als analog gespeichert. Seitdem hat auch die Vielfalt der Datentypen zugenommen. Dazu gehören Video, Audiodateien, Texte in E-Mails, Nachrichten in Social Media, Suchanfragen bei Google, Anzeigen auf Plattformen für den Verkauf gebrauchter Autos oder Einträge in Foren zu Gesundheitsfragen. Nur drei Prozent der Daten lassen sich über ein Schlagwort suchen. Um rasch fündig zu werden, braucht es eine leistungsfähige Technik, unter anderem In-Memory-Computer. Diese Rechner haben gigantisch große Arbeitsspeicher. Auf der Suche nach wichtigen Informationen durchforsten sie nicht mehr mühsam Festplatten, denn die Daten liegen abrufbereit im Arbeitsspeicher.