DATA SCIENTIST – Dank Big Data heiß begehrt!

Der Data Scientist zählt zu den sexiest Jobs des 21. Jahrhunderts. Dieser Eindruck bestätigt sich, wenn man einen Blick in die einschlägigen Online-Jobbörsen wirft. Laut einer Studie des McKinsey Global Institute [1] übersteigt in den USA der Bedarf das Angebot bei weitem –  in Deutschland scheint es nicht anders zu sein. Was macht denn dieses Berufsbild überhaupt so attraktiv? Einer, der es weiß, ist Dr. Andreas Jedlitschka, Abteilungsleiter Data Engineering am Fraunhofer IESE und Mitglied im Fachausschuss Data Science der Personenzertifizierungsstelle am Fraunhofer-Institut FIT, Sankt Augustin.

Wieso haben Unternehmen so einen enormen Bedarf an Datenspezialisten?

Mit der zunehmenden Vernetzung sämtlicher Bereiche bis hin zu digitalen Ökosystemen steigt auch die Flut von Daten in Unternehmen und Organisationen exponentiell an. Durch die zunehmende Verfügbarkeit und die Erfolgsgeschichten in der Presse wächst auch der Wunsch nach systematischer Nutzung der Daten, sprich nach Datenanalysen, und damit der Bedarf an Fachleuten, die diese vornehmen. Diese »Datenspezialisten« werden vielfach unter dem Begriff Data Scientist zusammengefasst.

Was macht überhaupt einen Data Scientist aus?

Zunächst möchte ich den Begriff »Data Science« definieren: Hierbei geht es darum, Wissen aus Daten zu extrahieren und das idealerweise zum Nutzen des Unternehmens. Dazu werden Methoden und Techniken aus der Informatik, Mathematik und der Statistik eingesetzt. Das Berufsbild ist vielfältig und reicht von Big Data Analytics und Visual Analytics über Big-Data-Architektur bis hin zur Integration. Zusätzlich müssen Geschäftsmodelle berücksichtigt bzw. neu entwickelt und damit auch verstanden werden. Ebenso ist mit dem Kunden, also dem Benutzer der Information als Adressaten, und dem Domänenexperten zu sprechen.

Welche Aufgaben übernehmen Data Scientists und welche Fähigkeiten müssen sie haben?

Data Scientists müssen Experten in mehreren Disziplinen zugleich sein: Sie werten nicht nur Daten aus, sondern müssen die betriebswirtschaftlichen Zusammenhänge in Unternehmen und Organisationen verstehen. Sie müssen geeignete Datenquellen identifizieren, Datenqualität bestimmen und verbessern, Daten zusammenstellen sowie die Analysen vorbereiten und durchführen und die Ergebnisse bezüglich vorgegebener Kriterien bewerten. Arbeitet man als Data Scientist, so trägt man oft große Verantwortung, da von den Ergebnissen der Datenanalysen beispielsweise auch weitreichende strategische Entscheidungen oder sogar Menschenleben abhängen können − man denke nur an Systeme zur Diagnoseunterstützung im Medizinbereich oder an Lernverfahren, die in autonomen Fahrzeugen an verschiedenen Stellen zum Einsatz kommen. Deshalb müssen die zugrundeliegenden Daten und die Analyseergebnisse in Zusammenarbeit mit Domänenexperten immer wieder auf Plausibilität, Vollständigkeit, Korrektheit und Relevanz überprüft werden. Das Anforderungsprofil an einen Data Scientist wächst entsprechend der Einbettung seiner Tätigkeit im Unternehmen und beinhaltet neben den technischen Fähigkeiten auch eine Reihe von Soft Skills wie zum Beispiel Teamfähigkeit, Kommunikationsstärke und Kreativität.

Wie kann ich Data Scientist werden? Welche Voraussetzungen bzw. Vorkenntnisse brauche ich dafür?

Bei Fraunhofer bieten wir im Rahmen der Allianz »Big Data« einen zertifizierten Lehrgang an und machen die Teilnehmer fit für Big-Data-Projekte. Teilnehmer sind vielfach Entscheider, aber vor allem Business Developer, Analysten, Data Manager und Softwareentwickler. Vorausgesetzt werden Grundlagen der Informatik und der Mathematik. In den Einsteigerkursen lernen die Teilnehmer die wesentlichen Grundlagen, Vorgehensweisen und Best Practices für den Umgang mit großen Datenmengen und die Entwicklung von intelligenten Lösungen mit hohen Standards an Datenschutz und Datensicherheit kennen. In den weiterführenden Kursen wird dann detailliert auf einzelne Verfahren eingegangen; dann steht das Anwendenkönnen im Vordergrund. Dabei vermitteln wir aktuellstes Wissen herstellerneutral, praxisnah und gleichzeitig theoretisch fundiert.

Auch Ihre eigenen Mitarbeiter schicken Sie ja zu diesem Zertifizierungslehrgang. Mit welchem Hintergrund qualifizieren Sie auch diese zum Data Scientist?

Meistens kommen unsere Wissenschaftler direkt von der Uni. Sie bringen sehr gutes Fachwissen speziell aus ihrem Studiengang mit, z.B. aus der Informatik oder Mathematik. Was den jungen Kolleginnen und Kollegen häufig jedoch fehlt, ist ein breiter Überblick und die praktische Erfahrung, um in Big-Data-Projekten mitarbeiten zu können. Und genau das lernen sie in unserem Lehrgang zum Data Scientist. Die Ausbildung ist auf die Breite ausgelegt. Sie erfahren, wie Business Developer die Potenziale von Big Data in ihrem Unternehmen erschließen, wie Dateningenieure Daten beschreiben und integrieren, wie Analysten mit maschinellen Lernverfahren Muster und Trends erkennen und wie Software-Ingenieure mit modernen Datenbanken und verteilten Berechnungsverfahren robuste und skalierbare Big-Data-Systeme entwickeln. All dies unter Berücksichtigung von Datenschutz und -sicherheit. Zielsetzung ist es, sich in allen relevanten Bereichen ein Basiswissen anzueignen. Wer möchte, kann sich dann noch zum Data Scientist zertifizieren lassen. Um unsere Kunden auf dem Weg zu Big Data mit unserem Expertenwissen kompetent begleiten zu können, nutzen wir natürlich solche Qualifizierungsmaßnahmen auch für unsere eigenen Wissenschaftler.

Zahlreiche Industriekunden haben bereits die Ausbildung bei Fraunhofer vollzogen. Wenn die Ausbildung zum Data Scientist so gefragt ist, übersteigt doch sicherlich die Zahl der Interessenten die Anzahl der Plätze in den Kursen?

Ja, das ist tatsächlich so. Im vergangenen Jahr mussten wir nahezu 80 Interessenten auf die Warteliste setzen. Dass sich der Lehrgang bei Fraunhofer für die Teilnehmer lohnt, zeigt der enorme Andrang. Der spricht auch für die Qualität unseres Angebots. Wer also Interesse hat, sollte sich frühzeitig anmelden.

Sind Sie daran interessiert, Data Scientist zu werden? Das Fraunhofer IESE und die Fraunhofer-Allianz Big Data bieten gemeinsam ein dreistufiges Zetrifaktsprogramm zum Data Scientist an. Für weitere Informationen über Data Science empfiehlt der Autor diese Website: https://towardsdatascience.com/

Quelle:
[1] https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation