Data Scientist — najseksowniejszy zawód świata

Data Scientist w swojej pracy zajmuje się przede wszystkim analizą danych i tworzeniem modeli statystycznych, które na podstawie dużej ilości danych uczą się rozpoznawać zachodzące prawidłowości.

Od paru lat w Stanach Zjednoczonych większość artykułów określających najbardziej perspektywiczne zawody świata opisuje Data Science jako ten najseksowniejszy w XXI wieku. Zapewne tytuł ten po części zawdzięcza modzie wykreowanej przez filmy i serial o Sherlocku Holmesie, który sprawił, że znów bardzo atrakcyjne stały się osoby będące w stanie znajdować wzory w pozornie chaotycznej gmatwaninie informacji. Zastanawiacie się, czym zajmuje się Data Scientist i jakie umiejętności powinna mieć osoba, która chce pracować w tym obszarze? Mamy nadzieję, że ten artykuł pozwoli Wam to rozjaśnić.

 

Kim jest Data Scientist?

 

Data Scientist w swojej pracy zajmuje się przede wszystkim analizą danych i tworzeniem modeli statystycznych, które na podstawie dużej ilości danych uczą się rozpoznawać zachodzące prawidłowości. To właśnie Data Science jest odpowiedzialna za wszelkiego rodzaju systemy rekomendacji (np. filmy na YouTube), inteligentne mechanizmy wyszukiwania (np. pozycjonowanie ofert pracy według preferencji użytkownika), mechanizmy antyspamowe, chatboty. Co jest więc potrzebne, by rozpocząć swoją przygodę z Data Science?

Lubisz kombinować lub szukać nieoczywistych powiązań? To może być praca dla Ciebie.
W swojej pracy Data Scientist musi być bardzo ostrożny, gdyż niejednokrotnie modele, które tworzy, mają duży wpływ na zyski oraz prestiż firmy.

Trzy filary:

 

     1. Programowanie

 

Jedną z podstawowych umiejętności, jakie musi posiadać Data Scientist jest programowanie. Wszelkie obliczenia, modele i wizualizacje tworzone są na podstawie wyspecjalizowanych pakietów programistycznych. W tym kontekście warto znać jeden z dwóch najbardziej rozpowszechnionych języków — Pythona lub R. Jednak nie musisz się obawiać! Jako Data Scientist nie trzeba być geniuszem programowania, a oba języki są zaliczane do najprostszych w całym przygotowaniu do zawodu.

 

     2. Statystyka

 

W swojej pracy Data Scientist musi być bardzo ostrożny, gdyż niejednokrotnie modele, które tworzy, mają duży wpływ na zyski oraz prestiż firmy. W przeciwieństwie do normalnych algorytmów te oparte na analizie statystycznej obarczone są pewnym błędem. Ważna więc staje się znajomość testowania statystycznego i metod estymacji, a także związanych z nimi niepewności (w końcu nasz nowy system odsiewania spamu nie może wyrzucać ważnych dla nas maili do kosza).

 

     3. Wiedza ekspercka

 

Data Scientist zawsze tworzy modele, wykorzystując wiedzę z dziedziny, której one dotyczą. To dość oczywiste! Jeżeli chcesz przedstawiać prawdopodobieństwo upadku firmy na rynku, musisz najpierw mieć wiedzę na temat tego, jakie dane są dostępne i jak je w ogóle zebrać.

 

Niezbędne cechy w tym zawodzie:

 

      1. Analityczne myślenie

 

Bez tego ani rusz w tej działce! Tworzenie modeli statystycznych na podstawie danych wymaga przeprowadzania ciągłych eksperymentów myślowych i rachunku logicznego. Ryzyko jest zbyt duże, ponieważ w tym zawodzie projekty potrafią trwać nawet pół roku i więcej, więc nie można pozwolić sobie na stratę czasu. Każda decyzja musi być zatem dokładnie rozważona.

 

     2. Abstrakcyjne myślenie

 

Lubisz kombinować lub szukać nieoczywistych powiązań? To może być praca dla Ciebie. W większości przypadków pracując jako Data Scientist masz do czynienia z ogromną ilością różnorodnych czynników i musisz zastanowić się nad tym, które z nich mogą mieć wpływ na szukaną zmienną. Przykład: Wyobraź sobie, że posiadasz dane dotyczące osób, którym proponowano przez telefon kredyt gotówkowy. Jakie czynniki mogą oznaczać, że dana osoba będzie bardziej skłonna do zawarcia takiej umowy? Na pewno będzie to długość rozmowy telefonicznej, fakt czy dana osoba brała już podobny kredyt, sytuacja materialna. Jakie cechy Ty byś jeszcze wymienił?

 

     3. Skrupulatność

 

Ze statystyką nie można się spieszyć. Lepiej dwa razy sprawdzić i upewnić się, że ma się rację niż po czasie płakać, że nasz model daje złe wyniki. Praca Data Scientista to tak naprawdę ciągłe wymyślanie hipotez, przygotowywanie danych i testowanie czy miało się rację. Nie jest to proste, bo łatwo zapomnieć o jakiś założeniu i dojść do bzdurnych wyników. Dlatego najpierw trenuje się model na jednym zbiorze danych, a na innym stara się go testować.

 

     4. Komunikatywność

 

Wiemy, że przedstawione obowiązki wydają się idealnie pasować do sylwetki introwertycznego naukowca, ale komunikacja jest w tym zawodzie kluczowa. Data Scientist pracuje na styku nauki i biznesu, a w związku z tym musi w prosty i zrozumiały sposób być w stanie przekazywać wyniki swoich badań. Niezbędna w tym kontekście okazuje się umiejętność dobrej wizualizacji oraz prezentacji danych. Trzeba też pamiętać, że dla przełożonych język naukowy nie musi być w pełni zrozumiały, a więc trzeba umieć dostosować przekaz do odbiorców.

 

Jak zacząć pracę jako Data Scientist?

 

Nie jest to takie oczywiste, ponieważ w Polsce nie istnieją studia o takim profilu. Najlepiej jest więc pójść na matematykę lub dowolny kierunek informatyczny, a brakującą część wiedzy rozwijać poza studiami. Jest wiele ciekawych platform e-learningowych, które mogą w tym pomóc (Edx, Udemy), gdzie można otrzymać dostęp do wielu darmowych kursów prowadzonych przez wykładowców z najlepszych uczelni na świecie. Trzeba jednak pamiętać, że wiedza teoretyczna to nie wszystko i warto już w trakcie studiów znaleźć dla siebie odpowiedni staż.