Hvad er forskellen mellem en-prøve og to-prøve t-test?


Bedste svar

en prøve t-test er en statistisk procedure, hvor du ville teste det hvor din befolknings gennemsnit er forskellig fra en konstant værdi (fix nummer). For eksempel ønsker en skole at teste, at det gennemsnitlige gennemsnit af GPA for gradstuderende er 3,0. De bruger en prøve t-test og kan få resultatet.

To prøve t-test er også en statistisk procedure, hvor du er interesseret i at teste, om disse to populationer har samme gennemsnit eller forskellige gennemsnit. I samme eksempel, hvis skolen er interesseret i at teste, er den gennemsnitlige GPA for naturfag og kunstfag den samme. Derefter ville de have brugt to-prøve t-test.

Svar

T-testen giver indsigt i, om forskellen mellem middel til to grupper skyldes tilfældighed eller er pålidelig (dvs. ville blive fundet igen i en anden måling fra den samme population). I modsætning til en beskrivende statistik , der beskriver prøven, der måles, er t-testen en inferentiel statistik , som beskriver prøven, der måles og giver en generalisering for hele befolkningen hvorfra prøven blev taget.

I mit arbejde bruger jeg generelt t-testen, når jeg evaluerer resultaterne af en A / B-test – dvs. en gruppe brugere præsenteres med en variation af et produktegenskab, og en anden gruppe af samme størrelse fra samme befolkning er præsenteret med “kontrol” (det eksisterende produktfunktion). Årsagen til, at t-testen er nyttig i dette scenarie, er, at den giver mig indsigt i, om forskellen mellem de to gruppers opførsel (målt ved gennemsnittet af nogle metricer normalt indtægter eller fastholdelse) skyldes tilfældigheder eller kan afhænge af, at det sker konsekvent. Kort sagt bruger jeg t-testen til at besvare spørgsmålet, “Ville forskellen ce mellem disse to grupper være de samme i en ny prøve fra den samme population? “

Resultaterne af en t-test evalueres gennem forholdet mellem forskellen mellem grupperne og forskellen inden for grupperne. Dette forhold er kendt som t-værdi ; t-værdien har en tilsvarende p-værdi , hvilket repræsenterer sandsynligheden for, at det, der observeres, kunne produceres ved tilfældige data. Jo lavere p-værdien er, desto mere sikker kan vi være på, at forskellen ikke frembringes tilfældigt og faktisk er en pålidelig forskel mellem de to gruppers middel. I forskning betragtes en p-værdi på 0,05 eller mindre generelt som pålidelig (statistisk signifikant), men i en mere iværksætterindstilling kan du beslutte, at en højere p-værdi er acceptabel. P-værdier svarer til t-værdier baseret på størrelsen af ​​prøverne; jo større prøvestørrelse (flere frihedsgrader), jo lavere er p-værdien for den samme t-værdi (forholdet mellem forskelle).

Du spurgte om alternativer til t-testen, og der er nogle, men først synes jeg, at jeg skulle identificere nogle variationer af t-testen, hvis du troede, at t-testen kun var nyttig i det scenarie, jeg beskrev ovenfor. Når en t-test måler pålideligheden af ​​forskellen mellem to prøver, som beskrevet ovenfor, kaldes den en Uafhængige prøver t-test. Når t-testen måler pålideligheden af ​​forskellen mellem en prøve ved to forskellige lejligheder, den kaldes en Parret-prøve t-test (så hvis du målte en gruppe brugere en gang , målte derefter den samme gruppe igen en uge senere, ville du udføre en parret prøve t-test). Og når t-testen måler forskellen mellem en prøve og et hypotetisk gennemsnit eller kendt populationsgennemsnit (som hvis vi målte gennemsnitlig daglig indtægt for nogle stikprøve af brugere i forhold til det, vi kender den gennemsnitlige daglige indtjening for hele vores tjeneste at være), kaldes det en En-prøve t- prøve.

Hvad angår alternativer til t-testen, er den mest populære Mann-Whitney U test, som er en ikke-parametrisk hypotese test, som er god at bruge, når fordelingen af ​​prøven og populationen ikke er normal (et blødt krav til t-testen).

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *