Migliore risposta
Circa $ 113.309 allanno, secondo Glassdoor (e come mostrato nello screenshot qui sotto).
Dipende anche in gran parte dallazienda, dal costo della vita nella zona in cui vivi e dalle tue responsabilità. Immagino che qualcuno con una vasta esperienza in machine learning / deep learning avrà uno stipendio più alto di qualcuno che ha conseguito un dottorato di ricerca al di fuori di un campo quantitativo rappresentativo (ad es. CS, matematica, ingegneria elettrica).
Risposta
La profondità e lampiezza delle competenze necessarie. Le competenze sono ampie e profonde e molto semplicemente non hanno lesperienza e listruzione per costruire modelli end-to-end.
È importante capire che più applicato lapprendimento automatico è programmazione. Se non puoi utilizzare Python e SQL, non sarai molto bravo nel mondo reale.
Ecco la pipeline di apprendimento automatico.
Passaggio 1 – Quasi tutti i modelli di machine learning sono basati sui dati che risiedono in un database relazionale. I dati sono spesso una delle risorse più importanti per le aziende. Ciò significa che le aziende vogliono che i dipendenti appena assunti abbiano esperienza di lavoro con esso. Questo elimina un sacco di persone. Cerchiamo un minimo di tre anni di esperienza nel mondo reale in qualsiasi tipo di vendor di SQL.
Passaggio 2 – Una volta che il set di dati è stato consolidato in un singolo array come entità dovrai pulirlo. Questo è un altro set di abilità che la maggior parte non ha. Gli studi hanno dimostrato che il machine learning più applicato è il data wrangling, quindi se non puoi massaggiare i tuoi dati in uno stato modellabile non verrai assunto.
Passaggio 3 – Modellazione. La parte divertente. Ancora un altro set di abilità. Avrai bisogno di sapere quali modelli utilizzare per un determinato problema. Dovrai modellare i dati, mettere a punto il modello, assegnarne un punteggio … ecc.
Passaggio 4 – Produzione. Una volta che il tuo modello è stato creato e testato con nuovi dati, dovrai metterlo in prod o aiutare qualcun altro a farlo. Sì, un altro insieme di competenze programmatiche.
Guarda questo video di YouTube. Sono alcune delle principali librerie di machine learning utilizzate in Python.
Ecco perché è così difficile trovare persone qualificate.
Passaggio 1 – Hai uno scapolo in qualcosa? Si spera qualcosa legato allo spazio. Questo ne elimina alcuni.
Passaggio 2 – Come va il tuo SQL. Hai 3 anni di esperienza nella creazione di query? Questo elimina molte persone in questo spazio. Elimina i ragazzi del campo di addestramento e molti statistici e matematici che hanno cambiato il loro titolo in data scientist. Quale join useresti per combinare tre tabelle in modo che vengano restituite solo le corrispondenze in tutte e tre? Che cosè una clausola where? Puoi spiegarmi come creare una pipeline per i dati che potrebbero essere utilizzati per lintero team?
Passaggio 3 – Sai programmare? Tutto ciò che facciamo è relativo al codice. Se non puoi programmare, sei nei guai. La maggior parte dei data scientist, anche i ben qualificati sono programmatori deboli.
Passaggio 4 – Data wrangling. Quasi tutto lapprendimento automatico applicato è supervisionato. Laspetto più importante per il successo del tuo modello sono dati puliti. Dopo aver creato il set di dati per la modellazione, è il momento di pulirlo. La mandria sta diventando davvero sottile ora. Ti interessano le discussioni sui dati? Inizia qui: Data Wrangling with Pandas for Machine Learning Engineers
Passaggio 5 – Modellazione. Una volta che il tuo set di dati è stato adeguatamente ripulito, come scegli quale modello usare? Nel mondo reale la maggior parte dei problemi sono la classificazione o la regressione. Dopo aver scelto il tuo modello, qual è una buona metrica utilizzata per valutarlo? Come metti a punto il tuo modello? Come si definisce un semplice modello Keras. Cosè XGBoost? Puoi scrivere sulla lavagna un semplice albero decisionale? Che cosè la convalida incrociata?
Passaggio 6 – Competenze cloud. Come ridimensionate i vostri modelli? Non puoi modellare un set di dati con un miliardo di righe sul tuo laptop. Ok, spostiamo i dati nel cloud. Come si ottengono questi dati su un cloud? Quale fornitore di cloud useresti? Puoi spiegarmelo?
Potrei continuare, ma penso che tu abbia capito.