De ce este considerată 30 dimensiunea minimă a eșantionului în unele forme de analiză statistică?


Cel mai bun răspuns

Vă mulțumim că ați întrebat. Vă rugăm să citiți următorul răspuns similar ..

De ce creștem dimensiunea eșantionului populației, atunci automat datele tind să urmeze curba de distribuție normală?

Dacă înțeleg întrebarea așa cum este formulată, coincidență aceasta este cea mai frecventă neînțelegere / interpretare greșită a teoremei limitei centrale (CLT). Greșeala pe care o fac oamenii este că ei cred că dacă ați adunat o cantitate uriașă de date, distribuția urmează automat distribuției normale. Nimic nu poate fi mai departe de adevăr. Și mai rău, în multe cursuri de formare, LSS Trainers s-a dovedit a recomanda ca pentru a utiliza confortabil o distribuție normală, este suficient de bună o practică pentru a colecta mai mult de 30 de puncte de date și puteți presupune în siguranță că eșantionul dvs. va urma Normal Distribuție. Vă rugăm, vă rugăm să nu vă confundați.

Despre CLT se vorbește despre distribuirea SAMPLE MEAN și nu despre distribuirea datelor, prin urmare, doar având mai mult de 30 de puncte de date în analiza dvs., întregul set de date nu va fi începeți să urmați Distribuția normală, nu-i așa? ȘI prieteni, de ce să fii copleșit cu distribuția normală (ND) deloc ….? Sunt de acord că, dacă datele de testare respectă ND, devine mai ușor să prezici comportamentul procesului de bază, dar chiar dacă datele nu sunt normale, poți folosi întotdeauna proprietățile distribuției pe care o urmează.

Dacă vorbim în mod specific despre procesele de afaceri în care se dorește îmbunătățirea, puteți utiliza întotdeauna diagramele de control. Este foarte recomandat să păstrăm lucrurile cât mai simplu posibil. Îmbunătățirea proceselor de afaceri este foarte ușoară, cu condiția să respectăm elementele de bază și să nu încercăm să presupunem că, dacă nu folosim instrumente de analiză dificile, nu putem rezolva probleme dificile de proces.

Sper că acest lucru vă va ajuta.

Răspuns

Probabilitatea de a obține un rezultat semnificativ statistic depinde de 4 lucruri: 1) Limita de valoare p pe care doriți să o utilizați (alfa). 2) Mărimea eșantionului. 3) Mărimea efectului în populație (sau dimensiunea minimă a efectului pe care sunteți interesat să o detectați).

Acestea sunt utilizate pentru a determina puterea – probabilitatea de a obține un rezultat semnificativ.

Alfa de 0,05 este aproape întotdeauna folosit, astfel încât să îl putem ignora.

Puterea este probabilitatea de a obține un rezultat semnificativ – cât de mare doriți să fie acest lucru? 80\% ar fi de ajuns? Adesea, oamenii cred că este, unii susțin 90\%. „Nu am văzut niciodată că s-a certat, dar dacă era cu adevărat important să știi că s-ar putea să vrei o putere mai mare.

Deci nu este necesară o„ dimensiune a eșantionului ”. Depinde de puterea pe care o ai dorința și dimensiunea efectului.

Putem folosi R (software gratuit pentru descărcare, Google it) pentru a calcula puterea.

Funcția power.prop.test () oferă puterea detectează o diferență de proporții.

De exemplu, dacă doresc un eșantion de 30 și 80\% putere, specific probabilitatea unui eveniment într-un singur grup – îl voi face 50\%:

> power.prop.test(p1 = .5, n=15, power =.8)

Rezultă că probabilitatea (adevărată) a evenimentului din celălalt grup trebuie să fie 0,94 pentru eșantionul meu de 30 să ai 80\% șanse să-l detectezi.

Two-sample comparison of proportions power calculation

n = 15

p1 = 0.5

p2 = 0.9412015

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Acest lucru ar fi de obicei considerat a fi un efect mult prea mare (sau echivalent, prea puțină putere).

Mărimea efectului pe care doriți să-l detectați depinde de costurile de a nu detecta efectul respectiv. De exemplu, dacă aș investiga efectul aspirinei asupra morții de atac de cord, aș fi interesat de un efect foarte mic – dacă pot opri 1 persoană din 100 să moară din cauza unui atac de cord cu o pastilă foarte ieftină pe zi, se merită. Deci poate cred că pot reduce rata deceselor de la 10\% la 9\%.

Pentru o șansă de 80\% de un rezultat semnificativ statistic, am nevoie de aproximativ 28.000 de persoane în studiul meu.

> power.prop.test(p1 = .1, p2=0.09, power =.8)

Two-sample comparison of proportions power calculation

n = 13494.97

p1 = 0.1

p2 = 0.09

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Dacă există alte riscuri sau costuri asociate tratamentului, atunci efectul va trebui să fie mai mare înainte de a fi „interesant pentru mine”, așa că nu aș avea nevoie de un studiu cu 30.000 de persoane.

Deci, răspunsul este între 30 și 30.000 de persoane. În funcție. Pe măsură ce creșteți dimensiunea eșantionului, precizia și certitudinea dvs. despre un efect crește. Și continuă să crească – nu puteți avea niciodată un eșantion prea mare.(cel puțin dacă nu există alte costuri asociate eșantionului).

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *