최상의 답변
Glassdoor 에 따르면 연간 약 $ 113,309 (그리고 아래 스크린 샷에 나와 있음).
또한 회사, 거주 지역의 생활비 및 책임에 따라 크게 달라집니다. 광범위한 기계 학습 / 딥 러닝 배경을 가진 사람이 대표적인 정량적 분야 (예 : CS, 수학, 전기 공학)를 벗어난 박사 학위를받은 사람보다 더 높은 급여를받을 것이라고 생각합니다.
답변
필요한 기술의 깊이와 폭. 기술은 광범위하고 깊으며 모델을 끝에서 끝까지 구축 할 경험과 교육이 없습니다.
가장 많이 적용된다는 점을 이해하는 것이 중요합니다. 기계 학습은 프로그래밍입니다. Python과 SQL을 사용할 수 없다면 현실 세계에서 그다지 좋지 않을 것입니다.
여기 기계 학습 파이프 라인이 있습니다.
1 단계 -거의 모든 머신 러닝 모델이 상주하는 데이터에 대해 빌드됩니다. 관계형 데이터베이스에서. 데이터는 종종 회사에서 가장 중요한 리소스입니다. 즉, 회사는 새로 고용 된 직원이 작업 경험을 갖기를 원합니다. 이것은 많은 사람들을 제거합니다. 모든 공급 업체의 SQL 버전에서 최소 3 년의 실제 경험을 기대합니다.
2 단계 -데이터 세트가 통합 된 후 엔티티와 같은 단일 배열로 정리해야합니다. 그것은 대부분의 기술이 가지고 있지 않은 또 다른 기술입니다. 연구에 따르면 대부분의 응용 기계 학습은 데이터 랭 글링이므로 데이터를 모델링 가능한 상태로 만들 수 없으면 고용되지 않습니다.
3 단계 -모델링. 재미있는 부분. 또 다른 기술 세트. 주어진 문제에 어떤 모델을 사용할지 알아야합니다. 데이터를 모델링하고, 모델을 조정하고, 점수를 매겨 야합니다. 등
4 단계 -생산. 모델을 구축하고 새로운 데이터에 대해 테스트 한 후에는 제품을 생산하거나 다른 사람이이를 수행하도록 도와야합니다. 네, 또 다른 프로그래밍 기술이 설정되었습니다.
YouTube 동영상 을 확인하세요. Python에서 사용되는 핵심 머신 러닝 라이브러리 중 일부입니다.
이렇게 자격을 갖춘 사람을 찾기가 어려운 이유입니다.
1 단계 -학사 학위가 있습니까? 공간과 관련이 있기를 바랍니다. 이것은 몇 가지를 제거합니다.
2 단계 -SQL은 어떻습니까? 쿼리 작성 경험이 3 년입니까? 이것은이 공간에서 많은 사람들을 제거합니다. 그것은 부트 캠프 아이들과 그들의 직함을 데이터 과학자로 바꾼 많은 통계 학자와 수학자를 제거합니다. 세 테이블을 결합하여 세 테이블 모두에서 일치하는 항목 만 반환되도록하려면 어떤 조인을 사용 하시겠습니까? where 절의 기능은 무엇입니까? 전체 팀에 사용할 수있는 데이터에 대한 파이프 라인을 만드는 방법에 대해 설명해 주시겠습니까?
3 단계 – 프로그래밍 할 수 있습니까? 우리가하는 모든 일은 코드와 관련이 있습니다. 코딩을 할 수 없다면 문제가있는 것입니다. 대부분의 데이터 과학자는 자격이있는 사람조차 약한 코더입니다.
4 단계 -데이터 랭 글링. 거의 모든 응용 기계 학습이 감독됩니다. 모델 성공의 가장 중요한 측면은 깨끗한 데이터입니다. 모델링을위한 데이터 세트를 만든 후에는 정리할 차례입니다. 이제 무리가 정말 얇아지고 있습니다. 데이터 랭 글링에 관심이 있으십니까? 여기에서 시작하세요. 기계 학습 엔지니어를위한 Pandas를 사용한 데이터 랭 글링
5 단계 -모델링. 데이터 세트가 올바르게 정리되면 사용할 모델을 어떻게 선택합니까? 현실 세계에서 대부분의 문제는 분류 또는 회귀입니다. 모델을 선택한 후 점수를 매기는 데 사용되는 좋은 측정 항목은 무엇입니까? 모델을 어떻게 조정합니까? 간단한 Keras 모델을 어떻게 정의합니까? XGBoost는 무엇입니까? 간단한 의사 결정 트리를 화이트 보드 할 수 있습니까? 교차 검증이 무엇인가요?
6 단계 -클라우드 기술. 모델을 어떻게 확장합니까? 노트북에서 10 억 개의 행이있는 데이터 세트를 모델링 할 수 없습니다. 좋습니다. 데이터를 클라우드로 이동하겠습니다. 그 데이터를 어떻게 클라우드로 가져 오나요? 어떤 클라우드 공급 업체를 사용 하시겠습니까? 자세히 설명해 주 시겠어요?
계속할 수는 있지만 아이디어를 얻은 것 같습니다.