Miksi 30: tä pidetään otoksen vähimmäiskokona joissakin tilastollisen analyysin muodoissa?


Paras vastaus

Kiitos kysymyksestäsi. Lue seuraava samanlainen vastaus.

Miksi kasvatamme populaation otoskokoa, sitten tiedot pyrkivät seuraamaan automaattisesti normaalijakautumiskäyrää?

Jos ymmärrän Kysymys sellaisena kuin se on muotoiltu, sattumalta tämä on keskirajalauseen (CLT) yleisin väärinkäsitys / väärinkäsitys. Virhe, jonka ihmiset tekevät, on, että jos olet kerännyt valtavan määrän tietoa, jakelu seuraa automaattisesti normaalijakaumaa. Mikään ei voi olla kauempana totuudesta. Vielä pahempaa on, että monilla kursseilla LSS-kouluttajat ovat todenneet suosittelevan, että normaalin jakelun mukava käyttäminen on tarpeeksi hyvä käytäntö kerätä yli 30 datapistettä, ja voit olettaa turvallisesti, että näytteesi noudattaa normaalia Jakelu. Ole hyvä ja älä sekaannu.

CLT puhuu NÄYTETARKOITUKSEN jakautumisesta eikä tietojen jakelusta, joten vain sillä, että analyysissasi on yli 30 datapistettä, koko tietojoukko ei alkaa seurata Normal Distribution, eikö ..? JA ystävät, miksi normaali jakauma (ND) on hukutettu ollenkaan ….? Olen samaa mieltä siitä, että jos testitietosi noudattavat ND: tä, on helpompaa ennustaa taustalla olevan prosessin käyttäytymistä, mutta vaikka tiedot eivät olisikaan normaalit, voit aina käyttää minkä tahansa jakelun ominaisuuksia.

Jos puhumme erityisesti liiketoimintaprosesseista, joissa parannusta halutaan, voit aina käyttää ohjaustaulukoita. On erittäin suositeltavaa pitää asiat mahdollisimman yksinkertaisina. Liiketoimintaprosessien parantaminen on erittäin helppoa, jos noudatamme perusasioita emmekä yritä olettaa, että jos emme käytä vaikeita analyysityökaluja, emme pysty ratkaisemaan vaikeita prosessiongelmia.

Toivottavasti tämä auttaa.

Vastaus

Tilastollisesti merkittävän tuloksen saamisen todennäköisyys riippuu neljästä asiasta: 1) P-arvon raja-arvo, jota haluat käyttää (alfa). 2) Näytteen koko. 3) Efektikoko populaatiossa (tai pienin efektikoko, jonka olet kiinnostunut havaitsemaan).

Näitä käytetään tehon määrittämiseen – todennäköisyyden saada merkittävä tulos.

Alfa-arvoa 0,05 käytetään melkein aina, jotta voimme jättää huomiotta.

Voima on todennäköisyys saada merkittävä tulos – kuinka suuri haluat tämän olevan? Riittäisikö 80\%? Usein ihmiset ajattelevat, että se on, jotkut väittävät kuitenkin 90 prosenttia. En ole koskaan nähnyt sen väittävän, mutta jos oli todella tärkeää, että tiesit, että haluat ehkä suuremman tehon.

Joten ei tarvita ”otoskokoa”. Se riippuu voimasta, jonka olet halu ja tehokoko.

Voimme käyttää virtaa R: llä (ilmainen ohjelmisto ladattavaksi, Google it).

Funktio power.prop.test () antaa voiman havaitse ero suhteissa.

Jos esimerkiksi haluan näytteen 30 ja 80\%: n tehosta, määritän tapahtuman todennäköisyyden yhdessä ryhmässä – teen siitä 50\%:

> power.prop.test(p1 = .5, n=15, power =.8)

Antaa tuloksen, että toisessa ryhmässä olevan tapahtuman (todellisen) todennäköisyyden on oltava 0,94, jotta saan 30-otoksen 80 prosentin mahdollisuus havaita se.

Two-sample comparison of proportions power calculation

n = 15

p1 = 0.5

p2 = 0.9412015

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Tämän katsotaan yleensä olevan liian suuri vaikutus (tai vastaavasti liian pieni teho).

Havaitavan vaikutuksen koko riippuu vaikutuksen havaitsematta jättämisen kustannuksista. Esimerkiksi, jos tutkisin aspiriinin vaikutusta kuolemaan sydänkohtaukseen, minua kiinnostaisi hyvin pieni vaikutus – jos voin estää yhden sadasta ihmisestä kuolemasta sydänkohtaukseen yhdellä erittäin edullisella pillerillä päivässä, se on sen arvoista. Joten luulen voivani vähentää kuolleisuuden 10 prosentista 9 prosenttiin.

Jotta 80 prosentin mahdollisuus saada tilastollisesti merkittävä tulos, tarvitsen tutkimukseen noin 28 000 henkilöä.

> power.prop.test(p1 = .1, p2=0.09, power =.8)

Two-sample comparison of proportions power calculation

n = 13494.97

p1 = 0.1

p2 = 0.09

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Jos hoitoon liittyy muita riskejä tai kustannuksia, vaikutuksen on oltava suurempi, ennen kuin se on mielenkiintoista minulle, joten en tarvitsisi tutkimusta, jossa olisi 30000 ihmistä.

Joten vastaus on välillä 30-30 000 ihmistä. Riippuen. Kun lisäät otoksen kokoa, tarkkuus ja varmuus vaikutuksesta kasvavat. Ja se kasvaa jatkuvasti – et voi koskaan olla liian suuri otos.(ainakin jos otokseen ei liity muita kustannuksia).

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *