Wat is het gemiddelde salaris voor een Ph.D. in data science?


Beste antwoord

Ongeveer $ 113.309 / jaar, volgens Glassdoor (en zoals weergegeven in de onderstaande schermafbeelding).

Het hangt ook grotendeels af van het bedrijf, de kosten van levensonderhoud in het gebied waarin u woont en uw verantwoordelijkheden. Ik stel me voor dat iemand met een uitgebreide machine learning / deep learning-achtergrond een hoger salaris zal hebben dan iemand die een PhD heeft gedaan buiten een representatief kwantitatief gebied (bijv. CS, wiskunde, elektrotechniek).

Antwoord

De diepte en breedte van de benodigde vaardigheden. De vaardigheden zijn breed en diep en hebben meestal niet de ervaring en opleiding om modellen van begin tot eind te bouwen.

Het is belangrijk om te begrijpen dat het meest wordt toegepast machine learning is programmeren. Als je Python en SQL niet kunt slingeren, ben je niet zo goed in de echte wereld.

Hier is de machine learning-pijplijn.

Stap 1 – Bijna alle machine learning-modellen zijn gebouwd op basis van gegevens die zich in een relationele database. Gegevens zijn vaak de belangrijkste bron van een bedrijf. Dat betekent dat bedrijven willen dat nieuw aangeworven werknemers ervaring hebben met het werken. Dit verwijdert een hoop mensen. We zoeken minimaal drie jaar praktijkervaring in elke smaak van SQL-leveranciers.

Stap 2 – Zodra uw dataset is geconsolideerd in een enkele array-achtige entiteit die u moet opschonen. Dat is een andere vaardigheden die de meesten niet hebben. Studies hebben aangetoond dat de meeste toegepaste machine learning data-wrangling is, dus als u uw gegevens niet in een modelleerbare staat kunt masseren, wordt u niet aangenomen.

Stap 3 – Modelleren. Het leuke gedeelte. Nog een andere vaardigheden. U moet weten welke modellen u voor een bepaald probleem moet gebruiken. U moet de gegevens modelleren, het model afstemmen, scoren …. etc.

Stap 4 – Productie. Zodra uw model is gebouwd en getest aan de hand van nieuwe gegevens, moet u het in de prik zetten of iemand anders daarbij helpen. Ja, weer een set programmatische vaardigheden.

Bekijk deze YouTube -video . Het zijn enkele van de belangrijkste bibliotheken voor machine learning die in Python worden gebruikt.

Hier is waarom het zo moeilijk is om gekwalificeerde mensen te vinden.

Stap 1 – Heb je ergens een bachelor in? Hopelijk iets met betrekking tot de ruimte. Dit verwijdert er een paar.

Stap 2 – Hoe gaat het met uw SQL. Heb je 3 jaar ervaring met het maken van vragen? Hierdoor worden veel mensen in deze ruimte uitgewist. Het verdrijft de bootcamp-kinderen en veel statistici en wiskundigen die hun titel hebben veranderd in datawetenschapper. Welke join zou je gebruiken om drie tafels te combineren, zodat alleen de wedstrijden van alle drie worden geretourneerd? Wat is een waar-clausule? Kun je me uitleggen hoe je een pijplijn maakt voor de gegevens die voor het hele team kunnen worden gebruikt?

Stap 3 – Kunt u programmeren? Alles wat we doen is code gerelateerd. Als u niet kunt coderen, heeft u problemen. De meeste datawetenschappers, zelfs de goed gekwalificeerde, zijn zwakke codeerders.

Stap 4 – Data ruzie. Vrijwel alle toegepaste machine learning wordt begeleid. Het allerbelangrijkste aspect van het succes van uw model zijn schone gegevens. Nadat u uw dataset voor modellering heeft gemaakt, is het tijd om deze op te schonen. De kudde wordt nu echt mager. Geïnteresseerd in data-wrangling? Begin hier: Data Wrangling with Pandas for Machine Learning Engineers

Stap 5 – Modellering. Als uw dataset eenmaal goed is opgeschoond, hoe kiest u dan welk model u wilt gebruiken? In de echte wereld zijn de meeste problemen classificatie of regressie. Nadat u uw model heeft gekozen, wat is een goede statistiek die wordt gebruikt om het te scoren? Hoe stem je je model af? Hoe definieer je een eenvoudig Keras-model? Wat is XGBoost? Kun je een eenvoudige beslissingsboom whiteboarden? Wat is kruisvalidatie?

Stap 6 – Cloudvaardigheden. Hoe schaal je je modellen? U kunt op uw laptop geen dataset met een miljard rijen modelleren. Oké, laten we de gegevens naar de cloud verplaatsen. Hoe krijg je die data naar een cloud? Welke cloudleverancier zou u gebruiken? Kun je me daar doorheen helpen?

Ik zou kunnen doorgaan, maar ik denk dat je het idee begrijpt.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *