Mikä on tohtorin mediaanipalkka datatieteessä?


Paras vastaus

Noin 113 309 dollaria vuodessa Glassdoorin mukaan näkyy alla olevassa kuvakaappauksessa).

Se riippuu suuresti myös yrityksestä, asumisesi elinkustannuksista ja vastuustasi. Kuvittelen, että jollakin, jolla on laaja koneoppiminen tai syvällinen oppimistausta, on korkeampi palkka kuin toisella, joka on suorittanut tohtorin tutkinnon edustavan kvantitatiivisen kentän ulkopuolella (esim. CS, matematiikka, sähkötekniikka).

Vastaus

Tarvittavien taitojen syvyys ja leveys. Taidot ovat laajoja ja syviä, eikä heillä yksinkertaisesti ole kokemusta ja koulutusta mallien rakentamiseen päästä päähän.

On tärkeää ymmärtää, että käytetään eniten koneoppiminen on ohjelmointia. Jos et pysty nostamaan Pythonia ja SQL: ää, et ole kovin hyvä todellisessa maailmassa.

Tässä on koneoppimisen vaihe.

Vaihe 1 – Lähes kaikki koneoppimismallit on rakennettu kotona olevien tietojen perusteella relaatiotietokannassa. Tiedot ovat usein yritysten tärkein resurssi. Tämä tarkoittaa, että yritykset haluavat vasta palkattujen työntekijöiden olevan kokemusta sen kanssa työskentelystä. Tämä rikkoo tonnia ihmisiä. Etsimme vähintään kolmen vuoden kokemusta reaalimaailmasta kaikilla SQL-toimittajien makuilla.

Vaihe 2 – Kun tietojoukko on yhdistetty yhdeksi taulukon kaltaiseksi kokonaisuudeksi, sinun on puhdistettava se. Se on toinen taitojoukko, jota useimmilla ei ole. Tutkimukset ovat osoittaneet, että suurin osa sovelletusta koneoppimisesta on tietojen sekoittamista, joten jos et pysty hieromaan tietojasi mallinnettavaan tilaan, et palkattu.

Vaihe 3 – mallinnus. Hauska osa. Vielä yksi taitojoukko. Sinun on tiedettävä, mitä malleja tietyssä ongelmassa käytetään. Sinun on mallinnettava tiedot, viritettävä malli, pisteytettävä se…. jne.

Vaihe 4 – Tuotanto. Kun mallisi on rakennettu ja testattu tuoreiden tietojen kanssa, sinun on lisättävä se tuotteisiisi tai autettava jotakuta muuta tekemään se. Jep, toinen ohjelmallinen taitojoukko.

Katso tämä YouTube -video . Se on muutama Pythonissa käytetyistä koneoppimisen kirjastoista.

Miksi päteviä ihmisiä on niin vaikea löytää.

Vaihe 1 – Onko sinulla poikamies jossakin? Toivottavasti jotain avaruuteen liittyvää. Tämä rikkoo muutaman.

Vaihe 2 – Kuinka SQL-järjestelmäsi sujuu. Onko sinulla 3 vuoden kokemus kyselyjen laatimisesta? Tämä rikkoo paljon ihmisiä tässä tilassa. Se rikkoo käynnistysleirin lapset ja monet tilastotieteilijät ja matemaatikot, jotka ovat muuttaneet otsikkonsa datatieteilijäksi. Millä liittymällä käytät kolmen pöydän yhdistämistä niin, että vain kaikkien kolmen ottelut palautetaan? Mitä lauseke tekee? Voitko kertoa minulle, miten luot putkilinjan tiedoille, joita voitaisiin käyttää koko tiimille?

Vaihe 3 – Voitko ohjelmoida? Kaikki mitä teemme, liittyy koodiin. Jos et pysty koodaamaan, olet pulassa. Suurin osa datatieteilijöistä, jopa hyvin pätevät, ovat heikkoja koodaajia.

Vaihe 4 – Tietojen sekoittaminen. Lähes kaikkea sovellettua koneoppimista valvotaan. Tärkein yksittäinen tekijä mallisi menestyksessä on puhdas data. Kun olet luonut tietojoukon mallinnusta varten, on aika puhdistaa se. Lauma on nyt todella ohut. Kiinnostaako tietojen kiistely? Aloita tästä: Datan kiertäminen pandojen kanssa koneoppimisinsinööreille

Vaihe 5 – mallinnus. Kun tietojoukko on puhdistettu kunnolla, miten valitset mallin, jota haluat käyttää? Todellisessa maailmassa suurin osa ongelmista on luokittelu tai regressio. Kun olet valinnut mallisi, mitä hyvää mittaria käytetään sen pisteyttämiseen? Kuinka virität malliasi? Kuinka määrität yksinkertaisen Keras-mallin. Mikä on XGBoost? Voitteko taululle yksinkertaisen päätöksentekopuun? Mitä ristivalidointi on?

Vaihe 6 – Pilvitaidot. Kuinka skaalat mallisi? Et voi mallintaa tietokonetta, jossa on miljardi riviä kannettavalla tietokoneellasi. Ok, siirretään tiedot pilveen. Kuinka saat nämä tiedot pilveen? Mitä pilvimyyjää käytät? Voitko käydä läpi tämän?

Voisin jatkaa, mutta luulen, että saat idean.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *