Jaka jest różnica między testem t dla jednej próbki a testem t dla dwóch próbek?


Najlepsza odpowiedź

test t dla jednej próbki to procedura statystyczna, w której chciałeś to sprawdzić gdzie średnia dla populacji jest inna niż stała wartość (stała liczba). Na przykład szkoła chce przetestować, że średnia średnia ocen ocen absolwentów wynosi 3,0. Będą używać testu t dla jednej próbki i mogą otrzymać wynik.

Test t dla dwóch prób jest również procedurą statystyczną, w której interesuje Cię sprawdzenie, czy te dwie populacje mają tę samą średnią, czy inną. W tym samym przykładzie, jeśli szkoła jest zainteresowana testowaniem tego samego średniego GPA na kierunku ścisłym i artystycznym. Wtedy użyliby testu t dla dwóch prób.

Odpowiedź

Test T zapewnia wgląd w to, czy różnica między średnimi z dwóch grup jest przypadkowa, czy też jest wiarygodna (tj. zostanie znaleziony ponownie w innym pomiarze z tej samej populacji). W przeciwieństwie do statystyki opisowej , która opisuje mierzoną próbkę, test t jest statystyką wnioskową , który opisuje mierzoną próbkę i zawiera uogólnienie dla całej populacji , z której próbka została pobrana.

W mojej pracy, generalnie używam testu t, gdy oceniam wyniki testu A / B – tj. jedna grupa użytkowników ma przedstawioną jedną odmianę cechy produktu, a inna, podobnej wielkości grupa z tej samej populacji jest przedstawione z „kontrolą” (istniejąca cecha produktu). Powodem, dla którego test t jest przydatny w tym scenariuszu, jest to, że daje mi wgląd w to, czy różnica między zachowaniem dwóch grup (mierzona średnią niektórych wskaźników; zwykle przychód lub zatrzymanie) jest przypadkowe lub konsekwentne, na którym można polegać. Krótko mówiąc, używam testu t, aby odpowiedzieć na pytanie „Czy różnica Czy te dwie grupy są takie same w nowej próbie z tej samej populacji? ”

Wyniki testu t są oceniane poprzez stosunek różnicy między grupami do różnicy w grupach. Ten stosunek jest znany jako wartość t ; wartość t ma odpowiadającą wartość p , która reprezentuje prawdopodobieństwo, że to, co zostanie zaobserwowane, może zostać wygenerowane przez dane losowe. Im niższa wartość p, tym bardziej jesteśmy pewni, że różnica nie jest wynikiem przypadku i jest rzeczywiście wiarygodną różnicą między średnimi obu grup. W badaniach wartość p wynosząca 0,05 lub mniej jest ogólnie uważana za wiarygodną (istotną statystycznie), ale w bardziej przedsiębiorczym otoczeniu możesz zdecydować, że wyższa wartość p jest akceptowalna. Wartości p odpowiadają wartościom t na podstawie wielkości próbek; im większy rozmiar próby (więcej stopni swobody), tym niższa wartość p dla tej samej wartości t (stosunek różnic).

Pytałeś o alternatywy dla testu t i są niektóre, ale myślę, że najpierw powinienem zidentyfikować kilka odmian testu t, na wypadek gdybyś myślał, że test t jest przydatny tylko w scenariuszu, który opisałem powyżej. Gdy test t mierzy wiarygodność różnicy między dwiema próbkami, jak opisano powyżej, nazywa się go niezależnymi próbkami testem t. Gdy test t mierzy wiarygodność różnicy między jedną próbką przy dwóch różnych okazjach, nazywa się to testem t Paired-Sample (więc jeśli zmierzyłeś jedną grupę użytkowników raz , a następnie zmierzyć tę samą grupę tydzień później, przeprowadziłbyś test t dla sparowanej próbki). A kiedy test t mierzy różnicę między jedną próbką a jakąś hipotetyczną średnią lub znaną średnią populacji (tak jak gdybyśmy zmierzyli średni dzienny przychód pewnej próby użytkowników w porównaniu z tym, jak znamy średni dzienny przychód z całej naszej usługi), nazywa się to Jedna próbka t- test.

Jeśli chodzi o alternatywy dla testu t, najpopularniejszym jest test U Manna-Whitneya , który jest hipotezą nieparametryczną test, który jest dobry w użyciu, gdy rozkłady próby i populacji nie są normalne (miękkie wymaganie dla testu t).

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *