博士号の給与の中央値はいくらですか。


ベストアンサー

Glassdoor によると、年間約$ 113,309(および下のスクリーンショットに示されています。

それはまた、会社、あなたが住んでいる地域での生活費、そしてあなたの責任にも大きく依存します。機械学習やディープラーニングのバックグラウンドが豊富な人は、代表的な定量的分野(CS、数学、電気工学など)以外で博士号を取得した人よりも給与が高くなると思います。

回答

必要なスキルの深さと幅。スキルは幅広く深いものであり、ほとんどの場合、モデルをエンドツーエンドで構築するための経験と教育がありません。

が最も適用されることを理解することが重要です。機械学習はプログラミングです。 PythonとSQLを使用できない場合、現実の世界ではあまり上手くなりません。

機械学習のパイプラインは次のとおりです。

ステップ1 -ほとんどすべての機械学習モデルは、常駐するデータに対して構築されていますリレーショナルデータベース内。多くの場合、データは企業にとって最も重要なリソースです。つまり、企業は新入社員にそれを使った経験を持たせたいと考えています。これはたくさんの人々を取り除きます。 SQLのベンダーフレーバーで最低3年の実社会での経験を求めています。

ステップ2 -データセットが統合されたらエンティティのような単一の配列に、それをクリーンアップする必要があります。これは、ほとんどの人が持っていないもう1つのスキルセットです。調査によると、ほとんどの応用機械学習はデータのラングリングであるため、データをモデル化可能な状態にマッサージできない場合、採用されることはありません。

ステップ3 -モデリング。楽しい部分。さらに別のスキルセット。特定の問題に使用するモデルを知る必要があります。データをモデル化し、モデルを調整し、スコアを付ける必要があります…。など。

ステップ4 -本番。モデルが構築され、新しいデータに対してテストされたら、モデルを本番環境に配置するか、他の誰かがそれを行うのを支援する必要があります。はい、別のプログラマティックスキルセットです。

このYouTube ビデオをご覧ください。これは、Pythonで使用されるコア機械学習ライブラリの一部です。

資格のある人を見つけるのが非常に難しい理由はここにあります。

ステップ1 -何かに学士号がありますか?うまくいけば、スペースに関連する何か。これにより、いくつかの要素が排除されます。

ステップ2 -SQLはどうですか。クエリの作成に3年の経験がありますか?これにより、このスペースの多くの人々が除草されます。それは、ブートキャンプの子供たちと、彼らの肩書きをデータサイエンティストに変えた多くの統計学者と数学者を取り除きます。 3つのテーブルを結合して、3つすべての一致のみが返されるようにするには、どの結合を使用しますか? where句は何をしますか?チーム全体で使用できるデータのパイプラインを作成する方法を教えていただけますか?

ステップ3 -プログラムできますか?私たちが行うことはすべてコード関連です。コーディングできない場合は、問題が発生しています。ほとんどのデータサイエンティストは、資格のある人でさえ弱いコーダーです。

ステップ4 -データラングリング。ほとんどすべての応用機械学習が監視されています。モデルの成功にとって最も重要な側面は、クリーンなデータです。モデリング用のデータセットを作成したら、それをクリーンアップします。群れは今本当に薄くなっています。データラングリングに興味がありますか?ここから開始:機械学習エンジニア向けのパンダを使用したデータラングリング

ステップ5 -モデリング。データセットが適切にクレンジングされたら、使用するモデルをどのように選択しますか?現実の世界では、ほとんどの問題は分類または回帰です。モデルを選択した後、それをスコアリングするために使用される適切な指標は何ですか?モデルをどのように調整しますか?単純なKerasモデルをどのように定義しますか。 XGBoostとは何ですか?簡単な決定木をホワイトボードに載せることはできますか?相互検証とは何ですか?

ステップ6 -クラウドスキル。モデルをどのようにスケーリングしますか?ノートパソコンで10億行のデータセットをモデル化することはできません。では、データをクラウドに移動しましょう。そのデータをどのようにクラウドに取得しますか?どのクラウドベンダーを使用しますか?それについて説明してもらえますか?

続行できますが、アイデアは得られたと思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です