Vad är medianlönen för en doktorsexamen inom datavetenskap?


Bästa svaret

Cirka 113 309 USD / år, enligt Glassdoor (och som visas på skärmdumpen nedan).

Det beror till stor del på företaget, levnadskostnaderna i det område du bor i och ditt ansvar. Jag föreställer mig att någon med en omfattande maskininlärnings- / djupinlärningsbakgrund kommer att ha en högre lön än någon som gjorde en doktorsexamen utanför ett representativt kvantitativt område (t.ex. = ”cccb62ee69″>

Svar

Djupet och bredden på de kunskaper som behövs. Färdigheterna är breda och djupa och har helt enkelt inte erfarenhet och utbildning för att bygga modeller från början till slut.

Det är viktigt att förstå att mest tillämpade maskininlärning är programmering. Om du inte kan sälja Python och SQL kommer du inte att vara mycket bra i den verkliga världen.

Här är maskininlärningsrörledningen.

Steg 1 – Nästan alla maskininlärningsmodeller är byggda mot data som finns i en relationsdatabas. Data är ofta en företags viktigaste resurs. Det betyder att företag vill att nyanställda ska ha erfarenhet av att arbeta med det. Detta rensar ut massor av människor. Vi letar efter minst tre års erfarenhet av verklig värld i alla leverantörer av SQL.

Steg 2 – När din dataset har konsoliderats i en enda array som enhet måste du rengöra den. Det är en annan skicklighet som de flesta inte har. Studier har visat att det mest tillämpade maskininlärningen är datavridning, så om du inte kan massera dina data till ett modellerbart tillstånd blir du inte anställd.

Steg 3 – Modellering. Den roliga delen. Ännu en kompetensuppsättning. Du måste veta vilka modeller du ska använda för ett visst problem. Du måste modellera data, ställa in modellen, göra poäng … etc.

Steg 4 – Produktion. När din modell är byggd och testad mot färsk data måste du lägga in den eller hjälpa någon annan att göra det. Japp, en annan uppsättning programmatiska färdigheter.

Kolla in den här YouTube videon . Det är några av de viktigaste maskininlärningsbiblioteken som används i Python.

Här är det så svårt att hitta kvalificerade personer.

Steg 1 – Har du en kandidatexamen i något? Förhoppningsvis något relaterat till utrymmet. Detta tar bort några få.

Steg 2 – Hur är din SQL. Har du 3 års erfarenhet av att skapa frågor? Detta ogräs ut många människor i detta utrymme. Det rensar ut boot camp-ungarna och många statistiker och matematiker som har bytt titel till datavetare. Vilken koppling skulle du använda för att kombinera tre tabeller så att endast matchningarna i alla tre returneras? Vad är en var-klausul? Kan du gå igenom hur du skapar en pipeline för de data som kan användas för hela teamet?

Steg 3 – Kan du programmera? Allt vi gör är kodrelaterade. Om du inte kan koda är du i trubbel. De flesta datavetare, även de välkvalificerade, är svaga kodare.

Steg 4 – Datavridning. Nästan all tillämpad maskininlärning övervakas. Den enskilt viktigaste aspekten av din modell framgång är ren data. När du har skapat din dataset för modellering är det dags att rengöra den. Flocken blir riktigt tunn nu. Intresserad av datakämpning? Börja här: Data Wrangling with Pandas for Machine Learning Engineers

Steg 5 – Modellering. När din dataset är ordentligt rengjord, hur väljer du vilken modell du ska använda? I den verkliga världen är de flesta problemen klassificering eller regression. När du har valt din modell, vad används ett bra mått för att göra det? Hur ställer du in din modell? Hur definierar du en enkel Keras-modell. Vad är XGBoost? Kan du skriva ett enkelt beslutsträd på whiteboard? Vad är korsvalidering?

Steg 6 – Molnfärdigheter. Hur skalar du dina modeller? Du kan inte modellera en dataset med en miljard rader på din bärbara dator. Okej, låt oss flytta data till molnet. Hur får du den informationen till ett moln? Vilken molnleverantör skulle du använda? Kan du gå igenom det?

Jag skulle kunna fortsätta men jag tror att du får idén.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *