¿Cuál es el salario medio de un Ph.D. en ciencia de datos?


La mejor respuesta

Aproximadamente $ 113,309 / año, según Glassdoor (y como que se muestra en la captura de pantalla a continuación).

También depende en gran medida de la empresa, el costo de vida en el área en la que vive y sus responsabilidades. Imagino que alguien con una amplia experiencia en aprendizaje automático / aprendizaje profundo tendrá un salario más alto que alguien que hizo un doctorado fuera de un campo cuantitativo representativo (p. Ej., Informática, matemáticas, ingeniería eléctrica).

Respuesta

La profundidad y amplitud de habilidades necesarias. Las habilidades son amplias y profundas y la mayoría simplemente no tiene la experiencia y la educación para construir modelos de un extremo a otro.

Es importante comprender que la mayoría aplica el aprendizaje automático es programación. Si no puede utilizar Python y SQL, entonces no será muy bueno en el mundo real.

Aquí está el proceso de aprendizaje automático.

Paso 1 : casi todos los modelos de aprendizaje automático se construyen con datos que residen en una base de datos relacional. Los datos suelen ser el recurso más importante de las empresas. Eso significa que las empresas quieren que los empleados recién contratados tengan experiencia trabajando con él. Esto elimina a un montón de personas. Buscamos un mínimo de tres años de experiencia en el mundo real en cualquier versión de proveedor de SQL.

Paso 2 : una vez que su conjunto de datos se haya consolidado en una sola matriz como entidad, necesitará limpiarla. Ese es otro conjunto de habilidades que la mayoría no tiene. Los estudios han demostrado que la mayor parte del aprendizaje automático aplicado consiste en la manipulación de datos, por lo que si no puede convertir sus datos en un estado modelable, no lo contratarán.

Paso 3 : modelado. La parte divertida. Otro conjunto de habilidades más. Necesitará saber qué modelos usar para un problema determinado. Deberá modelar los datos, ajustar el modelo, puntuarlo … etc.

Paso 4 – Producción. Una vez que su modelo esté construido y probado con datos nuevos, deberá ponerlo en producción o ayudar a otra persona a hacerlo. Sí, otro conjunto de habilidades programáticas.

Mira este video de YouTube. Son algunas de las bibliotecas centrales de aprendizaje automático que se utilizan en Python.

Aquí por qué es tan difícil encontrar personas calificadas.

Paso 1 – ¿Tienes una licenciatura en algo? Ojalá algo relacionado con el espacio. Esto elimina algunos.

Paso 2 : ¿Cómo está tu SQL? ¿Tiene 3 años de experiencia en la elaboración de consultas? Esto elimina a mucha gente en este espacio. Elimina a los niños del campo de entrenamiento y a muchos estadísticos y matemáticos que han cambiado su título a científico de datos. ¿Qué combinación usaría para combinar tres tablas de modo que solo se devuelvan las coincidencias en las tres? ¿Qué es una cláusula where? ¿Puede explicarme cómo crearía una canalización para los datos que podrían usarse para todo el equipo?

Paso 3 – ¿Puedes programar? Todo lo que hacemos está relacionado con el código. Si no puede codificar, está en problemas. La mayoría de los científicos de datos, incluso los bien calificados, son codificadores débiles.

Paso 4 : Reproducción de datos. Casi todo el aprendizaje automático aplicado está supervisado. La faceta más importante para el éxito de su modelo son los datos limpios. Una vez que haya creado su conjunto de datos para modelar, es hora de limpiarlo. La manada se está poniendo muy delgada ahora. ¿Interesado en la disputa de datos? Comience aquí: Gestión de datos con Pandas para ingenieros de aprendizaje automático

Paso 5 – Modelado. Una vez que su conjunto de datos se ha limpiado adecuadamente, ¿cómo elige qué modelo usar? En el mundo real, la mayoría de los problemas son de clasificación o regresión. Después de elegir su modelo, ¿cuál es una buena métrica para calificarlo? ¿Cómo sintonizas tu modelo? ¿Cómo se define un modelo de Keras simple? ¿Qué es XGBoost? ¿Puedes hacer una pizarra en un árbol de decisiones simple? ¿Qué es la validación cruzada?

Paso 6 : habilidades en la nube. ¿Cómo escalas tus modelos? No puede modelar un conjunto de datos con mil millones de filas en su computadora portátil. Bien, transfiramos los datos a la nube. ¿Cómo se transfieren esos datos a una nube? ¿Qué proveedor de nube usaría? ¿Puedes explicarme eso?

Podría continuar, pero creo que entiendes la idea.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *