ベストアンサー
1サンプルのt検定は、それをテストしたい統計的手順です。ここで、母集団の平均は定数値(固定数)とは異なります。たとえば、ある学校は、大学院生のGPAの平均が3.0であることをテストしたいと考えています。彼らは1つのサンプルt検定を使用し、結果を得ることができます。
2つのサンプルt検定は、これら2つの母集団の平均が同じか異なるかをテストすることに関心がある統計手順でもあります。同じ例で、学校が科学専攻と芸術専攻の平均GPAをテストすることに関心がある場合、同じです。次に、2標本のt検定を使用します。
回答
T検定は、2つのグループの平均の差が偶然によるものか信頼できるものかについての洞察を提供します。 (つまり、同じ母集団からの別の測定で再び見つかります)。測定対象のサンプルを説明する記述統計とは対照的に、t検定は推定統計です。 は、測定されるサンプルを説明し、、サンプルが取得された母集団全体の一般化を提供します。
In私の仕事では、A / Bテストの結果を評価するときに、通常t検定を使用します。つまり、ユーザーの1つのグループに製品機能のバリエーションが表示され、同じ母集団の同じサイズのグループに別のバリエーションが表示されます。 「コントロール」(既存の製品機能)が表示されます。このシナリオでt検定が役立つ理由は、2つのグループの動作の違い(いくつかのメトリックの平均で測定)についての洞察が得られるためです。通常、収益または保持)は偶然によるものであるか、一貫して発生することに依存する可能性があります。要するに、私はt検定を使用して、「違いはありますか?これら2つのグループ間のceは、同じ母集団からの新しいサンプルで同じですか?」
t検定の結果は、グループ間の差とグループ内の差の比率によって評価されます。この比率は、 t-value として知られています。 t値には対応する p値があります。これは、観測されたものがランダムデータによって生成される可能性を表します。 p値が低いほど、差が偶然に生成されたものではなく、実際に2つのグループの平均間の信頼できる差であると確信できます。研究では、.05以下のp値は一般に信頼できる(統計的に有意)と見なされますが、より起業家精神にあふれた設定では、より高いp値が許容できると判断する場合があります。 P値は、サンプルのサイズに基づくt値に対応します。サンプルサイズが大きいほど(自由度が大きいほど)、同じt値のp値は低くなります(差の比率)。
t検定の代替案について質問しましたが、いくつかですが、最初に、t検定が上記のシナリオでのみ有用であると考えた場合に備えて、t検定のいくつかのバリエーションを特定する必要があると思います。上記のように、t検定が2つのサンプル間の差の信頼性を測定する場合、それは独立サンプル t検定と呼ばれます。t検定の場合2つの異なる機会における1つのサンプル間の差の信頼性を測定します。これは、対応のあるサンプルのt検定と呼ばれます(したがって、1つのユーザーグループを1回測定した場合、次に同じグループを1週間後に再度測定すると、対応のあるサンプルのt検定を実行することになります。t検定で1つのサンプルと、いくつかの仮想平均または既知の母集団平均との差を測定する場合(サービス全体の平均日次収益であることがわかっているものに対する、ユーザーの一部のサンプルの1日あたりの平均収益)、 1サンプル t-と呼ばれます。テスト。
t検定の代替案として、最も人気のあるのは、ノンパラメトリック仮説であるマンホイットニーU 検定です。サンプルと母集団の分布が正常でない場合に使用するのに適した検定(t検定のソフト要件)。