Hvad er medianlønnen for en ph.d. inden for datalogi?


Bedste svar

Cirka $ 113.309 / år ifølge Glassdoor (og som vist på skærmbilledet nedenfor).

Det afhænger også i høj grad af virksomheden, leveomkostningerne i det område, du bor i, og dit ansvar. Jeg forestiller mig, at en person med en omfattende maskinlæring / dyb læringsbaggrund vil have en højere løn end en, der har en ph.d. uden for et repræsentativt kvantitativt felt (f.eks. CS, matematik, elektroteknik).

Svar

Dybden og bredden af ​​de nødvendige færdigheder. Færdighederne er brede og dybe og har simpelthen ikke erfaring og uddannelse til at bygge modeller fra ende til anden.

Det er vigtigt at forstå, at mest anvendte maskinindlæring er programmering. Hvis du ikke kan slynge Python og SQL, vil du ikke være meget god i den virkelige verden.

Her er pipeline til maskinindlæring.

Trin 1 – Næsten alle maskinlæringsmodeller er bygget op mod data, der findes i en relationsdatabase. Data er ofte en virksomheds vigtigste ressource. Det betyder, at virksomheder ønsker, at nyansatte medarbejdere skal have erfaring med at arbejde med det. Dette lukker masser af mennesker ud. Vi ser efter mindst tre års erfaring i den virkelige verden i enhver leverandørsmag af SQL.

Trin 2 – Når dit datasæt er blevet konsolideret i et enkelt array som en enhed, skal du rense det. Det er et andet færdighedssæt, de fleste ikke har. Undersøgelser har vist, at mest anvendt maskinindlæring er datakørsel, så hvis du ikke kan massere dine data til en modellerbar tilstand, bliver du ikke ansat.

Trin 3 – Modellering. Den sjove del. Endnu et sæt færdigheder. Du bliver nødt til at vide, hvilke modeller der skal bruges til et givet problem. Du bliver nødt til at modellere dataene, indstille modellen, score den …. osv.

Trin 4 – Produktion. Når din model er bygget og testet mod nye data, skal du sætte den i produkt eller hjælpe en anden med at gøre det. Ja, et andet sæt af programmatiske færdigheder.

Tjek denne YouTube video . Det er et par af de centrale maskinlæringsbiblioteker, der bruges i Python.

Her er hvorfor det er så svært at finde kvalificerede mennesker.

Trin 1 – Har du en bachelor i noget? Forhåbentlig noget relateret til rummet. Dette udrydder nogle få.

Trin 2 – Hvordan går det med din SQL. Har du 3 års erfaring med at lave forespørgsler? Dette udrydder mange mennesker i dette rum. Det udrydder boot camp-børnene og mange statistikere og matematikere, der har ændret deres titel til dataforsker. Hvilken sammenføjning vil du bruge til at kombinere tre tabeller, så kun kampene i alle tre returneres? Hvad er en hvor-klausul? Kan du gå igennem, hvordan du opretter en pipeline til de data, der kan bruges til hele teamet?

Trin 3 – Kan du programmere? Alt, hvad vi gør, er kode relateret. Hvis du ikke kan kode, er du i problemer. De fleste dataforskere, selv de velkvalificerede, er svage kodere.

Trin 4 – Data wrangling. Næsten al anvendt maskinindlæring er under opsyn. Den vigtigste aspekt af din models succes er rene data. Når du har oprettet dit datasæt til modellering, er det tid til at rense det. Besætningen bliver rigtig tynd nu. Er du interesseret i datakørsel? Start her: Data Wrangling with Pandas for Machine Learning Engineers

Trin 5 – Modellering. Når dit datasæt er ordentligt renset, hvordan vælger du, hvilken model du skal bruge? I den virkelige verden er de fleste problemer klassificering eller regression. Når er du valgt til din model, hvad bruges en god metric til at score den? Hvordan indstiller du din model? Hvordan definerer du en simpel Keras-model. Hvad er XGBoost? Kan du tavle et simpelt beslutningstræ? Hvad er krydsvalidering?

Trin 6 – Cloud-færdigheder. Hvordan skalerer du dine modeller? Du kan ikke modellere et datasæt med en milliard rækker på din bærbare computer. Ok, lad os flytte dataene til skyen. Hvordan får du disse data til en sky? Hvilken cloud-leverandør vil du bruge? Kan du gå igennem det?

Jeg kunne fortsætte, men jeg tror, ​​du får ideen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *