Jaka jest mediana pensji dla doktora? w nauce o danych?


Najlepsza odpowiedź

Według Glassdoor około 113 309 USD rocznie (i jak pokazano na poniższym zrzucie ekranu).

W dużej mierze zależy to również od firmy, kosztów utrzymania w okolicy, w której mieszkasz, i twoich obowiązków. Wyobrażam sobie, że ktoś z rozległym doświadczeniem w uczeniu maszynowym / głębokim uczeniu się będzie miał wyższe wynagrodzenie niż ktoś, kto zrobił doktorat poza reprezentatywną dziedziną ilościową (np. CS, matematyka, elektrotechnika).

Odpowiedź

Głębokość i zakres potrzebnych umiejętności. Umiejętności są szerokie i głębokie, a większość po prostu nie ma doświadczenia i wykształcenia, aby tworzyć modele od końca do końca.

Ważne jest, aby zrozumieć, że najczęściej stosowane uczenie maszynowe to programowanie. Jeśli nie potrafisz wykorzystać Pythona i SQL, nie będziesz zbyt dobry w prawdziwym świecie.

Oto potok uczenia maszynowego.

Krok 1 – Prawie wszystkie modele systemów uczących się są zbudowane na podstawie przechowywanych danych w relacyjnej bazie danych. Dane są często najważniejszym zasobem firmy. Oznacza to, że firmy chcą, aby nowo zatrudnieni pracownicy mieli doświadczenie w pracy z nimi. To eliminuje mnóstwo ludzi. Poszukujemy minimum trzyletniego doświadczenia w świecie rzeczywistym w dowolnej wersji SQL dostawcy.

Krok 2 – Po skonsolidowaniu zbioru danych w pojedynczą tablicę, taką jak encja, którą musisz wyczyścić. To kolejna umiejętność, której większość nie posiada. Badania wykazały, że większość stosowanych systemów uczących się to przepychanie danych, więc jeśli nie możesz wmasować swoich danych w modelowalny stan, nie zostaniesz zatrudniony.

Krok 3 – Modelowanie. Zabawna część. Kolejny zestaw umiejętności. Musisz wiedzieć, jakich modeli użyć w przypadku danego problemu. Musisz wymodelować dane, dostroić model, ocenić go…. itd.

Krok 4 – Produkcja. Gdy model zostanie zbudowany i przetestowany pod kątem świeżych danych, musisz go wypróbować lub pomóc w tym komuś innemu. Tak, kolejny zestaw umiejętności programistycznych.

Obejrzyj ten film w YouTube . To kilka z podstawowych bibliotek uczenia maszynowego używanych w Pythonie.

Oto dlaczego tak trudno jest znaleźć wykwalifikowanych ludzi.

Krok 1 – Czy masz coś kawalerskiego? Miejmy nadzieję, że coś związanego z przestrzenią. To eliminuje kilka.

Krok 2 – Jak wygląda Twój SQL. Czy masz 3 lata doświadczenia w tworzeniu zapytań? To eliminuje wielu ludzi w tej przestrzeni. Eliminuje to dzieciaki z obozów szkoleniowych oraz wielu statystyków i matematyków, którzy zmienili tytuł na naukowca danych. Jakiego sprzężenia użyłbyś, aby połączyć trzy stoły, tak aby zwracane były tylko dopasowania ze wszystkich trzech? Co to jest klauzula Where? Czy możesz mi przeprowadzić mnie przez proces tworzenia potoku danych, które mogłyby zostać wykorzystane przez cały zespół?

Krok 3 – Potrafisz zaprogramować? Wszystko, co robimy, jest związane z kodem. Jeśli nie możesz kodować, masz kłopoty. Większość analityków danych, nawet dobrze wykwalifikowani, są słabymi programistami.

Krok 4 – zmaganie się z danymi. Prawie całe stosowane uczenie maszynowe jest nadzorowane. Najważniejszym aspektem sukcesu Twojego modelu są czyste dane. Po utworzeniu zbioru danych do modelowania nadszedł czas, aby go wyczyścić. Stado staje się teraz naprawdę chude. Interesuje Cię walka o dane? Zacznij tutaj: Wymiana danych z pandami dla inżynierów systemów uczących się

Krok 5 – Modelowanie. Po prawidłowym wyczyszczeniu zbioru danych, w jaki sposób wybierasz model do użycia? W prawdziwym świecie większość problemów to klasyfikacja lub regresja. Jakie dobre dane są używane do oceny, po wybraniu modelu? Jak dostrajasz swój model? Jak zdefiniować prosty model Keras. Co to jest XGBoost? Czy umiesz przedstawić proste drzewo decyzyjne? Co to jest weryfikacja krzyżowa?

Krok 6 – umiejętności związane z chmurą. Jak skalujesz swoje modele? Nie możesz modelować zbioru danych z miliardem wierszy na swoim laptopie. OK, przenieśmy dane do chmury. Jak przenieść te dane do chmury? Jakiego dostawcy chmury byś użył? Czy możesz mi przez to przejść?

Mógłbym kontynuować, ale myślę, że masz pomysł.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *