Mekkora a medián fizetés egy Ph.D.-nél az adattudományban?


Legjobb válasz

Körülbelül 113 309 USD / év a Glassdoor szerint (és az alábbi képernyőképen látható.).

Ez nagyban függ a vállalattól, a megélhetési költségektől az Ön területén és a felelősségétől is. Úgy képzelem, hogy kiterjedt gépi vagy mély tanulási háttérrel rendelkező személynek magasabb fizetése lesz, mint annak, aki PhD fokozatot végzett egy reprezentatív kvantitatív területen kívül (pl. CS, matematika, elektrotechnika).

Válasz

A szükséges készségek mélysége és szélessége. A készségek szélesek és mélyek, és egyszerűen nincs tapasztalatuk és képzettségük a modellek végső megvalósításához.

Fontos megérteni, hogy a leginkább alkalmazható a gépi tanulás programozás. Ha nem tudja megkötni a Pythont és az SQL-t, akkor nem lesz sok jó a való világban.

Itt van a gépi tanulási folyamat.

1. lépés – Szinte az összes gépi tanulási modell a lakóhelyen található adatokra épül relációs adatbázisban. Az adatok gyakran a vállalatok legfontosabb erőforrásai. Ez azt jelenti, hogy a vállalatok azt akarják, hogy az újonnan felvett alkalmazottak tapasztalattal rendelkezzenek a munkában. Ez rengeteg embert gyomlál ki. Legalább hároméves valós tapasztalatot várunk az SQL bármely szállítói ízléséről.

2. Lépés – Miután az adatkészlet összevonásra került egyetlen tömbszerű entitásba kell tisztítania. Ez egy másik készség, amely a legtöbbnek nincs. Tanulmányok kimutatták, hogy a legtöbb alkalmazott gépi tanulás az adatkezelés, tehát ha nem tudod az adatokat modellezhető állapotba masszírozni, akkor nem fogsz felvenni. 3. lépés – Modellezés. A szórakoztató rész. Még egy készségkészlet. Tudnia kell, hogy az adott problémához milyen modelleket használjon. Meg kell modelleznie az adatokat, hangolnia kell a modellt, pontoznia kell…. stb.

4. lépés – Gyártás. Amint a modellt felépítették és friss adatokkal tesztelték, elő kell állítania őket, vagy segíteniük kell valakinek abban. Igen, egy másik programozási készségkészlet.

Nézze meg ezt a YouTube videót . Ez a Python által használt néhány gépi tanulási könyvtár.

1. lépés – Van valamilyen agglegényed? Remélhetőleg valami kapcsolódik a térhez. Ez kiszűr néhányat.

2. lépés – Milyen az SQL. Van 3 éves tapasztalata a lekérdezések elkészítésében? Ez sok embert gyomlál ki ezen a téren. Kiküszöböli a kezdőtábor gyerekeit és sok statisztikust és matematikust, akik címüket adatkutatóvá változtatták. Milyen csatlakozást használna három asztal kombinálásához, hogy csak a három meccset adja vissza? Mi a hol záradék? Végigvezetné, hogyan hozna létre egy vezetéket az adatok számára, amelyek felhasználhatók az egész csapat számára?

3. lépés – Tud programozni? Minden, amit csinálunk, kóddal kapcsolatos. Ha nem tud kódolni, akkor bajban van. A legtöbb adattudós, még a jól képzettek is, gyenge kódolók.

4. Lépés – Adatkezelés. Szinte minden alkalmazott gépi tanulás felügyelet alatt áll. A modell sikerének egyetlen legfontosabb eleme a tiszta adatok. Miután létrehozta az adatkészletet a modellezéshez, ideje tisztítani. A csorda most nagyon vékonyodik. Érdekel az adatkezelés? Kezdje itt: Pandákkal végzett adatkezelés gépi tanulási mérnökök számára

5. lépés – modellezés. Miután az adatkészlet megfelelően megtisztult, hogyan választhatja ki, hogy melyik modellt használja? A való világban a legtöbb probléma a besorolás vagy a regresszió. Miután kiválasztotta a modelljét, mi az a jó mutató, amelyet a pontozásához használnak? Hogyan hangolja be a modelljét? Hogyan definiálhat egy egyszerű Keras modellt. Mi az XGBoost? Fel tudsz táblázni egy egyszerű döntési fát? Mi a keresztellenőrzés?

6. lépés – Felhőbeli készségek. Hogyan méretezed a modelleidet? Nem modellezhet egy adatsort egymilliárd sorral a laptopján. Ok, helyezzük át az adatokat a felhőbe. Hogyan juttatja el ezeket az adatokat egy felhőbe? Milyen felhő szolgáltatót használna? Végig tudnád vinni?

Folytathatnám, de azt hiszem, megkapod az ötletet.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük