Miért tekintik a 30-at a minimális mintanagyságnak a statisztikai elemzés egyes formáiban?


A legjobb válasz

Köszönjük, hogy megkérdezte. Kérjük, olvassa el a következő hasonló választ.

Miért növeljük a populáció mintaméretét, akkor az adatok általában a normális eloszlási görbét követik?

Ha megértem a kérdés, amint megfogalmazódik, véletlenül ez a leggyakoribb félreértés / félremagyarázás a központi határtételről (CLT). Az emberek azt a hibát követik el, hogy szerintük, ha hatalmas mennyiségű adatot gyűjtött össze, az elosztás automatikusan követi a Normal elosztást. Semmi sem állhat távolabb az igazságtól. Még rosszabb, hogy sok tanfolyamon az LSS oktatók azt ajánlják, hogy Önnek a Normal Distribution kényelmes használata érdekében elég jó gyakorlat több mint 30 adatpont összegyűjtése, és nyugodtan feltételezheti, hogy a mintája követni fogja a Normal Terjesztés. Kérjük, kérjük, ne keverje össze.

Amiről a CLT beszél, az a MINTA Jelentés eloszlása, és nem az adatok terjesztése, ezért pusztán azáltal, hogy elemzésében több mint 30 adatpont van, a teljes adatsor nem kezdje el követni a Normal Distribution-et, ugye ..? ÉS barátok, miért kell elárasztani egyáltalán a normális eloszlást (ND) ….? Egyetértek azzal, hogy ha a tesztadatai megfelelnek az ND-nek, akkor könnyebb megjósolni az alapul szolgáló folyamat viselkedését, de még akkor is, ha az adatok nem normálisak, mindig használhatja bármelyik eloszlás tulajdonságait.

Ha kifejezetten azokról az üzleti folyamatokról beszélünk, amelyekben javításra van szükség, akkor mindig használhatja a Vezérlési diagramokat. Erősen ajánlott a dolgokat a lehető legegyszerűbben tartani. Az üzleti folyamatok fejlesztése nagyon egyszerű, ha betartjuk az alapokat, és nem próbáljuk azt feltételezni, hogy ha nem használunk nehéz elemzési eszközöket, akkor nem tudjuk megoldani a nehéz folyamatproblémákat.

Remélem, hogy ez segít.

Válasz

A statisztikailag szignifikáns eredmény elérésének valószínűsége 4 dologtól függ: 1) A használni kívánt p-érték cut-al (alfa). 2) A minta mérete. 3) Az effektus nagysága a populációban (vagy a minimális effektusméret, amelyet fel akarsz fedezni).

Ezeket a teljesítmény meghatározására használják – a jelentős eredmény elérésének valószínűségét.

A 0,05-ös alfa szinte mindig használatos, így figyelmen kívül hagyhatjuk.

A hatalom annak a valószínűsége, hogy jelentős eredményt érj el – mennyire akarod ezt? 80\% elég lenne? Gyakran az emberek ezt gondolják, vannak, akik 90\% -uk mellett érvelnek. Soha nem láttam, hogy érvelne érte, de ha valóban fontos volt, hogy tudta, hogy nagyobb teljesítményre vágyik.

Tehát nincs szükség „mintaméretre”. Ez attól függ, hogy milyen erővel rendelkezik a kívánt és az effektus mérete.

Az R (ingyenes szoftver letölthető, Google meg) segítségével felhasználhatjuk az energiafogyasztást.

A power.prop.test () függvény ad hatalmat az arányok közötti különbség észlelése.

Például, ha 30 és 80\% -os teljesítménymintát szeretnék, megadom egy esemény valószínűségét egy csoportban – 50\% -ot teszek rá:

> power.prop.test(p1 = .5, n=15, power =.8)

Olyan eredményt ad, hogy a másik csoportban az esemény (igaz) valószínűségének 0,94-nek kell lennie ahhoz, hogy a 30 fős mintám hogy 80\% esélye legyen a kimutatására.

Two-sample comparison of proportions power calculation

n = 15

p1 = 0.5

p2 = 0.9412015

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Ezt általában túl nagy hatásnak (vagy ekvivalensen túl kevés teljesítménynek) tekintenék.

Az észlelni kívánt effektus mérete attól függ, hogy mekkora költségeket észlel az effektus észlelése. Például, ha azt vizsgáltam, hogy az aszpirin milyen hatással van a szívrohamban való halálra, akkor egy nagyon kicsi hatás érdekelne engem – ha naponta egy nagyon olcsó tablettával le tudom állítani, hogy 100-ból 1 ember szívrohamban hal meg, megéri. Tehát talán azt gondolom, hogy 10\% -ról 9\% -ra tudom csökkenteni a halálozási arányt.

A statisztikailag szignifikáns eredmény 80\% -os esélyéhez körülbelül 28 000 személyre van szükségem a vizsgálatom során.

> power.prop.test(p1 = .1, p2=0.09, power =.8)

Two-sample comparison of proportions power calculation

n = 13494.97

p1 = 0.1

p2 = 0.09

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Ha más kockázatok vagy költségek társulnak a kezeléshez, akkor a hatásnak nagyobbnak kell lennie, mielőtt érdekes lenne számomra, ezért nincs szükségem egy tanulmányra, amelyben 30 000 ember szerepelne.

Tehát a válasz valahol 30-30 000 ember között van. Attól függően. A minta méretének növelésével növekszik a pontosság és a bizonyosság egy hatással kapcsolatban. És folyamatosan növekszik – soha nem lehet túl nagy a minta.(legalábbis, ha a mintához más költség nem kapcsolódik).

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük