Warum wird 30 in einigen Formen der statistischen Analyse als Mindeststichprobengröße angesehen?


Beste Antwort

Vielen Dank für Ihre Anfrage. Bitte lesen Sie die folgende ähnliche Antwort.

Warum erhöhen wir die Stichprobengröße der Population, dann folgen die Daten automatisch der Normalverteilungskurve?

Wenn ich das verstehe Frage, wie es gerahmt ist, zufällig ist dies das häufigste Missverständnis / Fehlinterpretation des Central Limit Theorem (CLT). Der Fehler, den die Leute machen, ist, dass sie denken, wenn Sie eine große Datenmenge gesammelt haben, folgt die Verteilung automatisch der Normalverteilung. Nichts kann weiter von der Wahrheit entfernt sein. Noch schlimmer ist, dass in vielen Schulungen LSS-Trainer empfohlen haben, eine Normalverteilung bequem zu verwenden. Es ist ausreichend, mehr als 30 Datenpunkte zu sammeln, und Sie können davon ausgehen, dass Ihre Stichprobe der Norm folgt Verteilung. Bitte, bitte lassen Sie sich nicht verwirren.

Worüber CLT spricht, ist die Verteilung der SAMPLE MEAN und nicht die Datenverteilung. Wenn Sie also mehr als 30 Datenpunkte in Ihrer Analyse haben, wird dies nicht der gesamte Datensatz tun Beginnen Sie mit der Normalverteilung, richtig ..? UND Freunde, warum sollte man überhaupt von der Normalverteilung (ND) überwältigt sein? Ich bin damit einverstanden, dass es einfacher wird, das Verhalten des zugrunde liegenden Prozesses vorherzusagen, wenn Ihre Testdaten ND folgen. Selbst wenn die Daten nicht normal sind, können Sie immer die Eigenschaften der Verteilung verwenden, der sie folgen.

Wenn wir speziell über die Geschäftsprozesse sprechen, in denen Verbesserungen gewünscht werden, können Sie immer die Kontrolldiagramme verwenden. Es wird dringend empfohlen, die Dinge so einfach wie möglich zu halten. Die Verbesserung von Geschäftsprozessen ist sehr einfach, vorausgesetzt, wir halten uns an die Grundlagen und versuchen nicht anzunehmen, dass wir schwierige Prozessprobleme nicht lösen können, wenn wir keine schwierigen Analysewerkzeuge verwenden.

Ich hoffe, dies hilft.

Antwort

Die Wahrscheinlichkeit, ein statistisch signifikantes Ergebnis zu erhalten, hängt von vier Faktoren ab: 1) Der p-Wert-Cutoff, den Sie verwenden möchten (Alpha). 2) Die Größe der Probe. 3) Die Effektgröße in der Grundgesamtheit (oder die minimale Effektgröße, die Sie erkennen möchten).

Diese werden verwendet, um die Leistung zu bestimmen – die Wahrscheinlichkeit, ein signifikantes Ergebnis zu erzielen.

Alpha von 0,05 wird fast immer verwendet, sodass wir eines ignorieren können.

Leistung ist die Wahrscheinlichkeit, ein signifikantes Ergebnis zu erzielen – wie hoch soll dies sein? Würden 80\% ausreichen? Oft denken die Leute, dass dies der Fall ist, einige argumentieren jedoch für 90\%. Ich habe noch nie gesehen, dass es argumentiert wurde, aber wenn es wirklich wichtig war, dass Sie wussten, dass Sie eine höhere Leistung wünschen.

Es ist also keine „Stichprobengröße“ erforderlich. Dies hängt von der Leistung ab, die Sie haben Größe wollen und bewirken.

Wir können R (kostenlose Software zum Herunterladen, Google it) verwenden, um die Leistung zu ermitteln.

Die Funktion power.prop.test () gibt die Leistung an Ermitteln Sie einen Unterschied in den Proportionen.

Wenn ich beispielsweise eine Stichprobe mit 30 und 80\% Leistung möchte, gebe ich die Wahrscheinlichkeit eines Ereignisses in einer Gruppe an – ich mache es zu 50\%:

> power.prop.test(p1 = .5, n=15, power =.8)

Gibt ein Ergebnis an, dass die (wahre) Wahrscheinlichkeit des Ereignisses in der anderen Gruppe 0,94 betragen muss, damit meine Stichprobe 30 beträgt eine 80\% ige Chance haben, es zu erkennen.

Two-sample comparison of proportions power calculation

n = 15

p1 = 0.5

p2 = 0.9412015

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Dies wird normalerweise als viel zu großer Effekt (oder gleichwertig als zu wenig Leistung) angesehen.

Die Größe des Effekts, den Sie erkennen möchten, hängt von den Kosten ab, die entstehen, wenn dieser Effekt nicht erkannt wird. Wenn ich zum Beispiel die Wirkung von Aspirin auf das Sterben an einem Herzinfarkt untersuchen würde, wäre ich an einem sehr geringen Effekt interessiert – wenn ich 1 von 100 Personen mit einer sehr billigen Pille pro Tag daran hindern könnte, an einem Herzinfarkt zu sterben, Das ist es wert. Vielleicht denke ich, ich kann die Sterblichkeitsrate von 10\% auf 9\% senken.

Für eine 80\% ige Chance auf ein statistisch signifikantes Ergebnis benötige ich ungefähr 28.000 Personen in meiner Studie.

> power.prop.test(p1 = .1, p2=0.09, power =.8)

Two-sample comparison of proportions power calculation

n = 13494.97

p1 = 0.1

p2 = 0.09

sig.level = 0.05

power = 0.8

alternative = two.sided

NOTE: n is number in *each* group

Wenn mit der Behandlung andere Risiken oder Kosten verbunden sind, muss der Effekt größer sein, bevor er für mich interessant ist, sodass ich keine Studie mit 30.000 Personen benötige.

Die Antwort liegt also zwischen 30 und 30.000 Personen. Abhängig. Wenn Sie die Stichprobengröße erhöhen, steigt Ihre Präzision und Gewissheit über einen Effekt. Und es nimmt ständig zu – man kann nie wirklich eine zu große Stichprobe haben.(Zumindest wenn mit der Stichprobe keine weiteren Kosten verbunden sind).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.