Nejlepší odpověď
jeden vzorek t-testu je statistický postup, kde jste jej chtěli otestovat kde se průměr vaší populace liší od konstantní hodnoty (fixní číslo). Například škola chce otestovat, že průměrný průměr GPA pro studenty ročníků je 3,0. Použijí jeden vzorek t-testu a mohou získat výsledek.
Dva vzorky t-testu jsou také statistickým postupem, kde vás zajímá testování, zda tyto dvě populace mají stejný průměr nebo jiný průměr. Ve stejném příkladu, pokud má škola zájem o testování, že průměrná GPA pro vědní a umělecké obory je stejná. Pak by použili dvouvýběrový t-test.
Odpověď
T-test poskytuje náhled na to, zda je rozdíl mezi prostředky dvou skupin způsoben náhodou nebo je spolehlivý (tj. nalezne se znovu v jiném měření ze stejné populace). Na rozdíl od popisné statistiky , která popisuje měřený vzorek, je t-test inferenční statistika , který popisuje měřený vzorek a poskytuje zobecnění pro celou populaci , ze které byl vzorek odebrán.
V ve své práci obvykle používám t-test, když hodnotím výsledky A / B testu – tj. jedné skupině uživatelů se zobrazuje jedna variace funkce produktu a další, podobně velké skupině ze stejné populace prezentováno s „kontrolou“ (stávající funkce produktu). Důvodem, proč je t-test v tomto scénáři užitečný, je ten, že mi dává vhled do toho, zda je rozdíl mezi chováním těchto dvou skupin (měřeno průměrem nějaké metriky; obvykle příjmy nebo zadržení) je způsobeno náhodou, nebo se dá spolehnout na to, že k němu dojde důsledně. Stručně řečeno, používám t-test k zodpovězení otázky: „Rozlišoval by se rozdíl ce mezi těmito dvěma skupinami jsou stejné v novém vzorku ze stejné populace? “
Výsledky t-testu se hodnotí pomocí poměru rozdílu mezi skupinami a rozdílu v rámci skupin. Tento poměr se nazývá t-hodnota ; hodnota t má odpovídající hodnotu p , což představuje pravděpodobnost, že to, co je pozorováno, může být vyprodukováno náhodnými daty. Čím nižší je hodnota p, tím více si můžeme být jisti, že rozdíl není způsoben náhodou a je to skutečně spolehlivý rozdíl mezi prostředky obou skupin. Ve výzkumu je p-hodnota 0,05 nebo méně obecně považována za spolehlivou (statisticky významnou), ale v podnikavějším prostředí se můžete rozhodnout, že je přijatelná vyšší p-hodnota. Hodnoty P odpovídají hodnotám t na základě velikosti vzorků; čím větší je velikost vzorku (více stupňů volnosti), tím nižší je hodnota p pro stejnou hodnotu t (poměr rozdílů).
Zeptali jste se na alternativy t-testu a existují některé, ale nejdřív si myslím, že bych měl identifikovat některé varianty t-testu, pro případ, že byste si mysleli, že je t-test užitečný pouze ve scénáři, který jsem popsal výše. Když t-test měří spolehlivost rozdílu mezi dvěma vzorky, jak je popsáno výše, nazývá se Nezávislé vzorky t-test. Když t-test měří spolehlivost rozdílu mezi jedním vzorkem při dvou různých příležitostech, říká se mu t-test Paired-Sample (takže pokud jste jednou změřili jednu skupinu uživatelů , poté o týden později změřili stejnou skupinu znovu, provedli byste párový t-test vzorku). A když t-test měří rozdíl mezi jedním vzorkem a nějakým hypotetickým průměrem nebo známým průměrem populace (jako kdybychom měřili průměrný denní příjem nějakého vzorku uživatelů oproti tomu, co známe, průměrný denní příjem celé naší služby), nazývá se to One-Sample t- test.
Pokud jde o alternativy k t-testu, nejoblíbenější je Mann-Whitney U test, což je neparametrická hypotéza test, který je dobré použít, když distribuce vzorku a populace nejsou normální (měkký požadavek na t-test).