Wir leben in einer Welt der Daten. Immer mehr Prozesse, Anwendungen und Systeme basieren vollständig auf der Verwendung von Nutzungs- und Bewegungsdaten, um das bestmögliche Ergebnis auszuliefern. Das geht soweit, dass die Ära der Daten als Megatrend für die nächsten 30 bis 50 Jahre zählt. In dieser neuen, digitalen Zeit braucht es eine andere Art von Experten, die sogenannten Data Scientists.
Data Science und Data Scientist
Data Science ist ganz grob gesagt die Kombination von statistischen Analysemethoden mit Big Data. Doch es geht weiter. Mittlerweile viele Jahre in Folge gilt der Job des Data Scientists als einer der heißesten Jobs auf dem Markt! Dabei geht es jedoch nicht nur um das Gehalt, welches in den USA beispielsweise bei rund 117.000 Dollar pro Jahr liegt, sondern auch um die Aufgaben. Im Data Science Bereich gehen die Profis auf die Suche nach Spuren. Als Innovaiton-Profiler klang es daher für mich wie eine Fähigkeit, die ich unbedingt beherrschen möchte.
What is Data Science? (Quelle: Simplilearn)
Durch einen glücklichen Zufall bin ich dabei auf das Bertelsmann Data Science Stipendium aufgemerksam geworden, welches das Unternehmen gemeinsam mit Udacity ausschreibt. Im Rahmen dieser Förderung werden 15.000 Bewerber auf die Grundlagen der Data Science ausgebildet. Die besten 1.500 Studenten erhalten tiefere Einblicke in Form eines Nano Degree, eines kleinen individuellen Online-Studiengangs, zum Business Analyst, Data Analyst oder Data Scientist.
Skills eines Data Scientists
Was muss ein Data Scientist beherrschen? Wie kann man sich durch die unendlichen Mengen an Daten graben? Nicht alle Experten müssen dabei Coder sein oder sich seit Jahren beschäftigen. Der erste Teil der Data Science Challenge ist daher passend für die Grundlagen. Man braucht im Bereich der Data Science einfach ein Verständnis über die wesentlichen Grundlagen der Statistik. Von elementaren Bestandteilen, wie dem Verfassen eines Fragebogens bis zu tieferen Einblicken in Mittelwert, z-Wert und Co. Auch die Visualisierung von Daten ist nicht zu unterschätzen. Viele Unternehmer kennen die verschiedenen Arten von Diagrammen und Grafiken, doch diese zu lesen und zu interpretieren, das ist eine ganz eigene Sache. Auch hier setzt der Udacity Kurs an und erklärt es in simplen, doch nachvollziehbaren Übungen und Lektionen.
Zu guter Letzt noch das Coding. Wenn Sie sich jetzt wundern, da ich sagte, man müsse kein Coder sein, keine Panik. Es braucht keinen Experten für jede existierende Programmiersprache. Die Grundlagen und ein Verständnis von Python und SQL reichen häufig aus, um die Mengen an Daten zu bewältigen.
Der nächste Schritt
Der nächste Schritt ist für mich nun die erste Phase abzuschließen und auf ein Nano Degree bei Udacity zu hoffen. Als Berater wäre für mich beispielsweise der Business Analyst am spannendsten, da er mein bisheriges Methodenset noch um die Data Science Fähigkeiten ergänzen würde.
Für alle anderen, die sich auf den Weg zum Data Science machen möchten, ist meine Botschaft: nicht aufgeben. Wer noch keine Erfahrungen in Statistik oder den genannten Programmsprachen hat, kann sich relativ schnell und mit etwas Hirnschmalz hineindenken. Die Mühen werden sich am Ende auszahlen.