Legjobb válasz
az egyik minta t-teszt egy statisztikai eljárás, ahol ezt tesztelni akarták ahol az Ön népességének átlaga eltér az állandó értéktől (fix szám). Például egy iskola azt akarja tesztelni, hogy a GPA átlagos átlaga a tanulók számára 3,0. Egy minta t-tesztet használnak, és megszerezhetik az eredményt.
A két minta t-teszt egyben statisztikai eljárás is, ahol érdekelt annak tesztelése, hogy ennek a két populációnak ugyanaz az átlaga vagy különböző-e az átlaga. Ugyanebben a példában, ha az iskola érdekelt annak tesztelésében, hogy a természettudományi és művészeti szakok átlagos GPA-ja megegyezik-e. Akkor kétmintás t-tesztet használtak volna.
Válasz
A T-teszt betekintést nyújt abba, hogy a két csoport átlaga közötti különbség véletlen-e, vagy megbízható-e. (azaz ugyanazon populáció egy másik mérésében ismét megtalálható lenne). A mért mintát leíró leíró statisztikával szemben a t-teszt következtetési statisztika , amely leírja a mért mintát , és általánosítást nyújt a teljes populációra , amelyből a mintát vették.
Munkám során általában akkor használom a t-tesztet, amikor egy A / B teszt eredményeit értékelem – azaz a felhasználók egyik csoportját egy termékjellemző egyik változatával mutatjuk be, míg egy másik, hasonló nagyságú csoport azonos populációból származik. a “kontroll” (a meglévő termékjellemző) bemutatása. A t-teszt azért hasznos ebben a szcenárióban, hogy betekintést enged abba, hogy a két csoport viselkedése közötti különbség (néhány mutató átlagával mérve; általában bevétel vagy megtartás) a véletlennek köszönhető, vagy attól függ, hogy következetesen megtörténik-e. Röviden: a t-teszt segítségével válaszolok a kérdésre: ” A két csoport közötti ce megegyezik ugyanazon populáció új mintájában? “
A t-teszt eredményeit a csoportok közötti különbség és a csoportokon belüli különbségek arányán keresztül értékelik. Ez az arány a t-érték néven ismert; a t-értéknek megvan a megfelelő p-értéke , amely annak valószínűségét képviseli, hogy a megfigyelt véletlenszerű adatokkal előállítható. Minél alacsonyabb a p-érték, annál biztosabbak lehetünk abban, hogy a különbség nem véletlenül keletkezik, és valóban megbízható különbség a két csoport átlaga között. A kutatás során a .05 vagy annál kisebb p-értéket általában megbízhatónak (statisztikailag szignifikánsnak) tekintik, de vállalkozóbb körülmények között dönthet úgy, hogy magasabb p-érték elfogadható. A P-értékek megegyeznek a minták méretén alapuló t-értékekkel; minél nagyobb a minta mérete (több szabadságfok), annál alacsonyabb a p-érték ugyanazon t-értéknél (a különbségek aránya).
A t-teszt alternatíváiról kérdeztél, és vannak néhányat, de először azt gondolom, hogy meg kellene határoznom a t-teszt néhány változatát, ha úgy gondolta, hogy a t-teszt csak az általam fent leírt forgatókönyvben hasznos. Amikor a t-teszt két minta közötti különbség megbízhatóságát méri, a fentiek szerint, akkor Független Minták t-tesztnek nevezzük. két minta alkalmával méri az egyik minta közötti különbség megbízhatóságát, ezt Párosított minta t-tesztnek hívják (tehát ha egyszer megmért egy felhasználói csoportot , majd egy héttel később megmértük ugyanazt a csoportot, akkor párosított minta t-tesztet hajtunk végre. És amikor a t-teszt méri az egy minta és a hipotetikus átlag vagy ismert populáció átlagának különbségét (például a felhasználók egy mintájának átlagos napi bevétele az egész szolgáltatásunk átlagos napi bevételével összehasonlítva), ezt Egy minta t- teszt.
A t-teszt alternatíváit illetően a legnépszerűbb a Mann-Whitney U teszt, amely nem paraméteres hipotézis teszt, amelyet akkor érdemes használni, ha a minta és a populáció eloszlása nem normális (a t-teszt puha követelménye).