Care este salariul mediu pentru un doctorat în știința datelor?


Cel mai bun răspuns

Aproximativ 113 309 USD / an, conform Glassdoor (și ca afișat în captura de ecran de mai jos).

De asemenea, depinde în mare măsură de companie, de costul vieții în zona în care locuiți și de responsabilitățile dvs. Îmi imaginez că cineva cu o experiență vastă de învățare automată / învățare profundă va avea un salariu mai mare decât cineva care a făcut un doctorat în afara unui domeniu cantitativ reprezentativ (de exemplu, CS, matematică, inginerie electrică).

Răspuns

Adâncimea și amploarea abilităților necesare. Abilitățile sunt largi și profunde și pur și simplu nu au experiența și educația pentru a construi modele cap la cap.

Este important să înțelegem că este cel mai aplicat învățarea automată programează. Dacă nu poți prinde Python și SQL, atunci nu vei fi prea bun în lumea reală.

Iată conducta de învățare automată.

Pasul 1 – Aproape toate modelele de învățare automată sunt construite pe baza datelor care se află într-o bază de date relațională. Datele sunt adesea o resursă importantă a companiilor. Asta înseamnă că companiile doresc ca angajații nou angajați să aibă experiență de lucru cu acesta. Acest lucru elimină o mulțime de oameni. Căutăm un minim de trei ani de experiență în lumea reală în orice tip de furnizor SQL.

Pasul 2 – Odată ce setul de date a fost consolidat într-o singură matrice ca entitate, va trebui să o curățați. Aceasta este o altă abilitate pe care majoritatea nu o au. Studiile au arătat că cele mai multe aplicații de învățare automată sunt conflicte de date, deci dacă nu puteți masa datele într-o stare modificabilă, nu veți fi angajat.

Pasul 3 – Modelare. Partea distractivă. Încă un alt set de abilități. Va trebui să știți ce modele să folosiți pentru o anumită problemă. Va trebui să modelați datele, să le reglați, să le înscrieți … etc.

Pasul 4 – Producție. Odată ce modelul dvs. este construit și testat în funcție de date noi, va trebui să îl introduceți sau să ajutați altcineva să facă acest lucru. Da, un alt set de abilități programatice.

Vedeți acest videoclip YouTube . Este câteva dintre principalele biblioteci de învățare automată utilizate în Python.

Iată de ce este atât de greu să găsești oameni calificați.

Pasul 1 – Aveți burlaci în ceva? Sperăm că ceva legat de spațiu. Acest lucru elimină câteva.

Pasul 2 – Cum vă stă SQL. Aveți 3 ani de experiență în elaborarea interogărilor? Acest lucru elimină o mulțime de oameni în acest spațiu. Îi elimină pe copiii din tabără și pe mulți statistici și matematicieni care și-au schimbat titlul în cercetător de date. Ce înscriere ați folosi pentru a combina trei tabele astfel încât să fie returnate doar meciurile din toate trei? Ce este clauza unde? Poți să mă treci prin modul în care ai crea o conductă pentru datele care ar putea fi utilizate pentru întreaga echipă?

Pasul 3 – Poți programa? Tot ceea ce facem este legat de cod. Dacă nu poți codifica, atunci ai probleme. Majoritatea oamenilor de știință din domeniul datelor, chiar și cei bine calificați, sunt codificatori slabi.

Pasul 4 – Lupta datelor. Aproape toată învățarea automată aplicată este supravegheată. Cea mai importantă fațetă a succesului modelului dvs. este datele curate. După ce ați creat setul de date pentru modelare, este timpul să îl curățați. Turma devine foarte subțire acum. Vă interesează lupta de date? Începeți aici: Lupta de date cu panda pentru inginerii de învățare automată

Pasul 5 – Modelare. Odată ce setul de date este curățat corect, cum alegeți ce model să utilizați? În lumea reală, cele mai multe probleme sunt clasificarea sau regresia. După ce v-ați ales modelul, care este metrica bună folosită pentru a-l înscrie? Cum îți reglezi modelul? Cum definiți un model Keras simplu. Ce este XGBoost? Poți să dai tabla albă unui simplu arbore de decizie? Ce este validarea încrucișată?

Pasul 6 – Abilități în cloud. Cum vă scalați modelele? Nu puteți modela un set de date cu un miliard de rânduri pe laptop. Ok, să mutăm datele în cloud. Cum obțineți aceste date într-un nor? Ce furnizor de cloud ai folosi? Poți să mă treci prin asta?

Aș putea continua, dar cred că ai ideea.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *