Quel est le salaire médian dun doctorat? en science des données?


Meilleure réponse

Environ 113 309 $ / an, selon Glassdoor (et comme illustrée dans la capture décran ci-dessous).

Cela dépend également en grande partie de lentreprise, du coût de la vie dans la région dans laquelle vous vivez et de vos responsabilités. Jimagine quune personne ayant une vaste expérience en apprentissage automatique / apprentissage en profondeur aura un salaire plus élevé quune personne qui a fait un doctorat en dehors dun domaine quantitatif représentatif (par exemple, CS, mathématiques, génie électrique).

Réponse

La profondeur et létendue des compétences nécessaires. Les compétences sont vastes et approfondies et la plupart nont tout simplement pas lexpérience et la formation nécessaires pour créer des modèles de bout en bout.

Il est important de comprendre que est le plus appliqué lapprentissage automatique est la programmation. Si vous ne pouvez pas utiliser Python et SQL, vous ne serez pas très doué dans le monde réel.

Voici le pipeline dapprentissage automatique.

Étape 1 – Presque tous les modèles dapprentissage automatique sont construits à partir de données résidant dans une base de données relationnelle. Les données sont souvent la ressource la plus importante des entreprises. Cela signifie que les entreprises veulent que les employés nouvellement embauchés aient une expérience de travail avec elle. Cela élimine une tonne de gens. Nous recherchons un minimum de trois ans dexpérience dans le monde réel dans nimporte quel type de fournisseur de SQL.

Étape 2 – Une fois votre ensemble de données consolidé dans un seul tableau comme une entité dont vous aurez besoin pour le nettoyer. C’est un autre ensemble de compétences que la plupart n’ont pas. Des études ont montré que la plupart des applications de machine learning sont le traitement des données, donc si vous ne pouvez pas masser vos données dans un état modélisable, vous ne serez pas embauché.

Étape 3 – Modélisation. La partie amusante. Encore un autre ensemble de compétences. Vous aurez besoin de savoir quels modèles utiliser pour un problème donné. Vous devrez modéliser les données, ajuster le modèle, le noter…. etc.

Étape 4 – Production. Une fois votre modèle construit et testé avec de nouvelles données, vous devrez le mettre en production ou aider quelquun dautre à le faire. Oui, un autre ensemble de compétences programmatiques.

Regardez cette vidéo YouTube. Ce sont quelques-unes des principales bibliothèques dapprentissage automatique utilisées en Python.

Voici pourquoi il est si difficile de trouver des personnes qualifiées.

Étape 1 – Avez-vous un baccalauréat dans quelque chose? Espérons que quelque chose lié à lespace. Cela en élimine quelques-uns.

Étape 2 – Comment va votre SQL. Avez-vous 3 ans dexpérience dans la création de requêtes? Cela élimine beaucoup de monde dans cet espace. Il élimine les enfants du camp dentraînement et de nombreux statisticiens et mathématiciens qui ont changé leur titre de scientifique des données. Quelle jointure utiliseriez-vous pour combiner trois tables de sorte que seules les correspondances des trois soient renvoyées? Que fait une clause where? Pouvez-vous mexpliquer comment créer un pipeline pour les données qui pourraient être utilisées pour toute léquipe?

Étape 3 – Pouvez-vous programmer? Tout ce que nous faisons est lié au code. Si vous ne pouvez pas coder, vous avez des problèmes. La plupart des data scientist, même les plus qualifiés, sont des codeurs faibles.

Étape 4 – Data wrangling. Presque tout lapprentissage automatique appliqué est supervisé. L’aspect le plus important du succès de votre modèle est la propreté des données. Une fois que vous avez créé votre ensemble de données pour la modélisation, il est temps de le nettoyer. Le troupeau devient vraiment mince maintenant. Intéressé par le data wrangling? Commencez ici: Data Wrangling with Pandas for Machine Learning Engineers

Étape 5 – Modélisation. Une fois votre jeu de données correctement nettoyé, comment choisissez-vous le modèle à utiliser? Dans le monde réel, la plupart des problèmes sont la classification ou la régression. Une fois que vous avez choisi votre modèle, quelle est la bonne statistique utilisée pour le noter? Comment ajustez-vous votre modèle? Comment définir un modèle Keras simple. Quest-ce que XGBoost? Pouvez-vous dresser un tableau blanc dun simple arbre de décision? Quest-ce que la validation croisée?

Étape 6 – Compétences cloud. Comment mettez-vous vos modèles à léchelle? Vous ne pouvez pas modéliser un ensemble de données avec un milliard de lignes sur votre ordinateur portable. OK, déplaçons les données vers le cloud. Comment acheminer ces données vers un cloud? Quel fournisseur de cloud utiliseriez-vous? Pouvez-vous mexpliquer cela?

Je pourrais continuer mais je pense que vous avez compris lidée.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *