Paras vastaus
yksi näyte t-testi on tilastollinen menettely, jossa haluat testata missä väestösi keskiarvo on erilainen kuin vakioarvo (kiinteä luku). Esimerkiksi koulu haluaa testata, että GPA: n keskiarvo keskiasteen opiskelijoille on 3,0. He käyttävät yhtä näyte-t-testiä ja voivat saada tuloksen.
Kaksi näyte-t-testi on myös tilastollinen menettely, jossa olet kiinnostunut testaamaan, onko näiden kahden populaation keskiarvo sama vai erilainen. Samassa esimerkissä, jos koulu on kiinnostunut testaamaan, että luonnontieteiden pääaineiden ja taiteiden pääaineiden keskimääräinen GPA on sama. Sitten he olisivat käyttäneet kahden otoksen t-testiä.
Vastaus
T-testi antaa oivalluksen siitä, johtuuko kahden ryhmän keskiarvojen ero sattumasta vai onko se luotettava (ts. löydettäisiin uudelleen toisesta saman populaation mittauksesta). Toisin kuin kuvaava tilasto , joka kuvaa mitattavaa otosta, t-testi on pääteltävä tilasto , joka kuvaa mitattavaa otosta ja tarjoaa yleiskuvan koko populaatiolle , josta näyte otettiin.
Työssäni käytän yleensä t-testiä, kun arvioin A / B-testin tuloksia – toisin sanoen yhdelle käyttäjäryhmälle esitetään yksi muunnelma tuoteominaisuudesta ja toinen saman kokoinen ryhmä samasta populaatiosta on esitettiin ”kontrollilla” (nykyinen tuoteominaisuus). Syy, miksi t-testi on hyödyllinen tässä skenaariossa, on se, että se antaa minulle käsityksen siitä, onko näiden kahden ryhmän käyttäytymisen ero (mitattuna joidenkin mittareiden keskiarvolla; yleensä tulo tai pidättäminen) johtuu sattumasta tai voi riippua siitä, että se tapahtuu jatkuvasti. Lyhyesti sanottuna käytän t-testiä vastaamaan kysymykseen: ”Eri ce näiden kahden ryhmän välillä on sama uudessa otoksessa samasta populaatiosta? ”
t-testin tulokset arvioidaan ryhmien välisen eron ja ryhmien sisäisen eron perusteella. Tämä suhde tunnetaan nimellä t-arvo ; t-arvolla on vastaava p-arvo , joka edustaa todennäköisyyttä, että havaittu voidaan tuottaa satunnaisella datalla. Mitä pienempi p-arvo, sitä varmempia voimme olla, että eroa ei synny sattumalta ja että se on todellakin luotettava ero kahden ryhmän keskiarvojen välillä. Tutkimuksessa p-arvoa 0,05 tai vähemmän pidetään yleensä luotettavana (tilastollisesti merkitsevänä), mutta yrittäjemmässä ympäristössä voit päättää, että suurempi p-arvo on hyväksyttävä. P-arvot vastaavat t-arvoja näytteiden koon perusteella; Mitä suurempi otoskoko (enemmän vapausasteita), sitä pienempi on saman t-arvon p-arvo (erojen suhde).
Kysyit vaihtoehdoista t-testille, ja t Jotkut, mutta mielestäni minun pitäisi tunnistaa joitain t-testin muunnelmia, jos luulit, että t-testi on hyödyllinen vain edellä kuvatussa skenaariossa. Kun t-testi mittaa kahden näytteen välisen eron luotettavuutta, kuten edellä on kuvattu, sitä kutsutaan itsenäisiksi näytteiksi t-testiksi. Kun t-testi mittaa yhden otoksen välisen luotettavuuden kahdessa eri tilanteessa, sitä kutsutaan Paired-Sample t-testiksi (joten jos mitattiin yksi käyttäjäryhmä kerran , sitten mitattiin sama ryhmä uudelleen viikkoa myöhemmin, suoritat parillisen näytteen t-testin). Ja kun t-testi mittaa eron yhden näytteen ja jonkin hypoteettisen keskiarvon tai tunnetun populaatiokeskiarvon välillä (kuten jos joidenkin käyttäjien otosten keskimääräiset päivätulot verrattuna siihen, minkä tiedämme olevan koko palvelumme keskimääräiset päivätulot), sitä kutsutaan Yksi näyte t- testata.
T-testin vaihtoehdoista suosituin on Mann-Whitney U -testi, joka on ei-parametrinen hypoteesi testi, jota on hyvä käyttää, kun otoksen ja populaation jakaumat eivät ole normaaleja (pehmeä vaatimus t-testille).