Dlaczego 30 jest uważane za minimalną wielkość próby w niektórych formach analizy statystycznej?


Najlepsza odpowiedź

Dziękuję za pytanie. Przeczytaj następującą podobną odpowiedź.

Dlaczego zwiększamy wielkość próby populacji, a następnie automatycznie dane mają tendencję do podążania za krzywą rozkładu normalnego?

Jeśli rozumiem pytanie, jakie zostało sformułowane, przypadkowo jest to najczęstsze nieporozumienie / błędna interpretacja Centralnego Twierdzenia Granicznego (CLT). Błędem, który popełniają ludzie, jest to, że myślą, że jeśli zebrałeś ogromną ilość danych, rozkład automatycznie przebiega zgodnie z rozkładem normalnym. Nic nie może być dalsze od prawdy. Co gorsza, na wielu kursach szkoleniowych trenerzy LSS zalecali, aby wygodnie korzystać z dystrybucji normalnej, wystarczy zebrać więcej niż 30 punktów danych i możesz bezpiecznie założyć, że twoja próbka będzie zgodna z normalną Dystrybucja. Proszę, nie daj się zmylić.

To, o czym mówi CLT, to dystrybucja ŚREDNIA PRÓBKI, a nie dystrybucja danych, dlatego po prostu mając więcej niż 30 punktów danych w analizie, cały zestaw danych nie będzie zacznij podążać za rozkładem normalnym, prawda ..? ORAZ przyjaciele, po co w ogóle być przytłoczonym rozkładem normalnym (ND)…? Zgadzam się, że jeśli dane testowe są zgodne z ND, łatwiej jest przewidzieć zachowanie podstawowego procesu, ale nawet jeśli dane są nienormalne, zawsze możesz użyć właściwości dowolnego rozkładu, po którym następują.

Jeśli mówimy konkretnie o procesach biznesowych, w których pożądane jest ulepszenie, zawsze możesz skorzystać z Kart kontrolnych. Zdecydowanie zaleca się, aby wszystko było tak proste, jak to tylko możliwe. Doskonalenie procesów biznesowych jest bardzo łatwe pod warunkiem, że trzymamy się podstaw i nie próbujemy zakładać, że jeśli nie używamy trudnych narzędzi analizy, nie możemy rozwiązać trudnych problemów procesowych.

Mam nadzieję, że to pomoże.

Odpowiedź

Prawdopodobieństwo uzyskania statystycznie istotnego wyniku zależy od 4 rzeczy: 1) Odcięcia wartości p, którego chcesz użyć (alfa). 2) Wielkość próbki. 3) Wielkość efektu w populacji (lub minimalny rozmiar efektu, który chcesz wykryć).

Są one używane do określenia mocy – prawdopodobieństwa uzyskania znaczącego wyniku.

Alfa 0,05 jest prawie zawsze używana, więc taką, którą możemy zignorować.

Potęga to prawdopodobieństwo uzyskania znaczącego wyniku – jak wysokie chcesz to osiągnąć? Czy 80\% wystarczy? Często ludzie tak myślą, ale niektórzy twierdzą, że 90\%. Nigdy nie widziałem, żeby się o to spierało, ale jeśli to było naprawdę ważne, wiedziałeś, że możesz chcieć wyższej mocy.

Więc nie ma wymaganej „wielkości próbki”. To zależy od mocy, z jaką chcesz i wielkość efektu.

Możemy użyć R (darmowe oprogramowanie do pobrania, Google it) do obliczenia mocy.

Funkcja power.prop.test () daje moc wykryć różnicę w proporcjach.

Na przykład, jeśli chcę próbkę o mocy 30 i 80\%, określam prawdopodobieństwo zdarzenia w jednej grupie – zrobię 50\%:

> power.prop.test(p1 = .5, n=15, power =.8)

Daje wynik, że (prawdziwe) prawdopodobieństwo zdarzenia w drugiej grupie musi wynosić 0,94, aby moja próbka wynosiła 30 mieć 80\% szans na wykrycie go.

Two-sample comparison of proportions power calculation

n = 15

p1 = 0.5

p2 = 0.9412015

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Zwykle byłoby to uważane za zbyt duży efekt (lub równoważnie za małą moc).

Rozmiar efektu, który chcesz wykryć, zależy od kosztów niewykrywania tego efektu. Na przykład, gdybym badał wpływ aspiryny na śmierć z powodu zawału serca, byłbym zainteresowany bardzo małym efektem – jeśli uda mi się powstrzymać 1 osobę na 100 umierającą na atak serca jedną bardzo tanią pigułką dziennie, to jest tego warte. Więc może myślę, że mogę zmniejszyć śmiertelność z 10\% do 9\%.

Aby uzyskać 80\% szans na statystycznie istotny wynik, potrzebuję około 28 000 osób w moim badaniu.

> power.prop.test(p1 = .1, p2=0.09, power =.8)

Two-sample comparison of proportions power calculation

n = 13494.97

p1 = 0.1

p2 = 0.09

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Jeśli istnieją inne zagrożenia lub koszty związane z leczeniem, to efekt będzie musiał być większy, zanim stanie się to dla mnie interesujące, więc nie potrzebowałbym badania z udziałem 30 000 osób.

Więc odpowiedź brzmi od 30 do 30 000 osób. W zależności. W miarę zwiększania rozmiaru próbki zwiększa się precyzja i pewność efektu. I rośnie – nigdy nie można mieć zbyt dużej próbki.(przynajmniej jeśli nie ma innych kosztów związanych z próbką).

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *