Qual é o salário médio de um doutorado. em ciência de dados?


Melhor resposta

Cerca de US $ 113.309 / ano, de acordo com Glassdoor (e como mostrado na captura de tela abaixo).

Também depende muito da empresa, do custo de vida na área em que você mora e de suas responsabilidades. Imagino que alguém com um amplo histórico de aprendizado de máquina / aprendizado profundo terá um salário mais alto do que alguém que fez um PhD fora de um campo quantitativo representativo (por exemplo, CS, matemática, engenharia elétrica).

Resposta

A profundidade e amplitude das habilidades necessárias. As habilidades são amplas e profundas e a maioria simplesmente não tem experiência e educação para construir modelos de ponta a ponta.

É importante entender que é mais aplicável aprendizado de máquina é programação. Se você não consegue usar Python e SQL, não será muito bom no mundo real.

Este é o canal de aprendizado de máquina.

Etapa 1 – Quase todos os modelos de aprendizado de máquina são construídos com base nos dados que residem em um banco de dados relacional. Os dados costumam ser o recurso mais importante das empresas. Isso significa que as empresas desejam que os funcionários recém-contratados tenham experiência em trabalhar com ela. Isso elimina uma tonelada de pessoas. Procuramos um mínimo de três anos de experiência no mundo real em qualquer tipo de fornecedor de SQL.

Etapa 2 – Assim que seu conjunto de dados tiver sido consolidado em um único array como entidade, você precisará limpá-lo. Esse é outro conjunto de habilidades que a maioria não tem. Estudos demonstraram que a maior parte do aprendizado de máquina aplicado consiste em transformação de dados, então se você não conseguir transformar seus dados em um estado modelável, não será contratado.

Etapa 3 – Modelagem. A parte divertida. Mais um conjunto de habilidades. Você precisará saber quais modelos usar para um determinado problema. Você precisará modelar os dados, ajustar o modelo, pontuá-lo … etc.

Etapa 4 – Produção. Depois que seu modelo for construído e testado em relação a dados novos, você precisará colocá-lo em produção ou ajudar outra pessoa a fazer isso. Sim, outro conjunto de habilidades programáticas.

Confira este vídeo do YouTube. São algumas das principais bibliotecas de aprendizado de máquina usadas em Python.

Aqui está porque é tão difícil encontrar pessoas qualificadas.

Etapa 1 – Você é solteiro em alguma coisa? Esperançosamente, algo relacionado ao espaço. Isso elimina alguns.

Etapa 2 – Como está o seu SQL. Você tem 3 anos de experiência na elaboração de consultas? Isso elimina muitas pessoas neste espaço. Isso elimina as crianças do campo de treinamento e muitos estatísticos e matemáticos que mudaram seu título para cientista de dados. Qual junção você usaria para combinar três tabelas de modo que apenas as correspondências em todas as três sejam retornadas? O que é uma cláusula where? Você pode me explicar como criaria um pipeline para os dados que poderia ser usado para toda a equipe?

Etapa 3 – Você pode programar? Tudo o que fazemos está relacionado ao código. Se você não consegue codificar, então você está com problemas. A maioria dos cientistas de dados, mesmo os bem qualificados, são codificadores fracos.

Etapa 4 – Organização de dados. Quase todo aprendizado de máquina aplicado é supervisionado. O aspecto mais importante para o sucesso do seu modelo são os dados limpos. Depois de criar seu conjunto de dados para modelagem, é hora de limpá-lo. O rebanho está ficando muito magro agora. Interessado em troca de dados? Comece aqui: Organização de dados com Pandas para engenheiros de aprendizado de máquina

Etapa 5 – Modelagem. Depois que seu conjunto de dados estiver devidamente limpo, como você escolhe o modelo a ser usado? No mundo real, a maioria dos problemas são de classificação ou regressão. Depois de escolher seu modelo, qual é uma boa métrica usada para pontuá-lo? Como você ajusta seu modelo? Como você define um modelo Keras simples. O que é XGBoost? Você pode criar uma árvore de decisão simples no quadro branco? O que é validação cruzada?

Etapa 6 – Habilidades na nuvem. Como você dimensiona seus modelos? Você não pode modelar um conjunto de dados com um bilhão de linhas em seu laptop. Ok, vamos mover os dados para a nuvem. Como você leva esses dados para uma nuvem? Qual fornecedor de nuvem você usaria? Você pode me explicar isso?

Eu poderia continuar, mas acho que você entendeu.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *