Beste antwoord
een t-test met één steekproef is een statistische procedure waarbij je dat wilde testen waarbij uw populatiegemiddelde anders is dan een constante waarde (vast getal). Een school wil bijvoorbeeld testen dat het gemiddelde gemiddelde van GPA voor afgestudeerde studenten 3,0 is. Ze gebruiken één steekproef van een t-test en kunnen het resultaat krijgen.
Twee steekproeven t-test is ook een statistische procedure waarbij je wilt testen of deze twee populaties hetzelfde gemiddelde of een ander gemiddelde hebben. In hetzelfde voorbeeld, als de school geïnteresseerd is in het testen, is die gemiddelde GPA voor science major en arts major hetzelfde. Dan zouden ze twee steekproeven t-toets hebben gebruikt.
Antwoord
De T-toets geeft inzicht of het verschil tussen de gemiddelden van twee groepen te wijten is aan toeval of betrouwbaar is (dwz zou opnieuw worden gevonden in een andere meting van dezelfde populatie). In tegenstelling tot een beschrijvende statistiek , die de steekproef beschrijft die wordt gemeten, is de t-test een inferentiële statistiek , die de gemeten steekproef beschrijft en een generalisatie geeft voor de hele populatie waaruit de steekproef is genomen.
In mijn werk, gebruik ik over het algemeen de t-test wanneer ik de resultaten van een A / B-test evalueer – dwz een groep gebruikers krijgt de ene variant van een productkenmerk te zien en een andere groep van vergelijkbare grootte uit dezelfde populatie is gepresenteerd met de “controle” (het bestaande productkenmerk) De reden dat de t-test nuttig is in dit scenario is dat het me inzicht geeft in of het verschil tussen het gedrag van de twee groepen (gemeten door het gemiddelde van een metriek; meestal inkomsten of retentie) is te wijten aan toeval of kan ervan worden verwacht dat dit consequent gebeurt. Kortom, ik gebruik de t-toets om de vraag te beantwoorden: Zou het verschil ce tussen deze twee groepen hetzelfde zijn in een nieuwe steekproef uit dezelfde populatie? “
De resultaten van een t-test worden beoordeeld aan de hand van de verhouding tussen het verschil tussen de groepen en het verschil binnen de groepen. Deze verhouding staat bekend als de t-waarde ; de t-waarde heeft een overeenkomstige p-waarde , die de waarschijnlijkheid vertegenwoordigt dat wat wordt waargenomen, kan worden geproduceerd door willekeurige gegevens. Hoe lager de p-waarde, hoe zekerder we kunnen zijn dat het verschil niet door toeval wordt veroorzaakt en inderdaad een betrouwbaar verschil is tussen de gemiddelden van de twee groepen. In onderzoek wordt een p-waarde van 0,05 of minder over het algemeen als betrouwbaar (statistisch significant) beschouwd, maar in een meer ondernemende omgeving kunt u besluiten dat een hogere p-waarde acceptabel is. P-waarden komen overeen met t-waarden op basis van de grootte van de monsters; hoe groter de steekproefomvang (meer vrijheidsgraden), hoe lager de p-waarde voor dezelfde t-waarde (verhouding van verschillen).
U vroeg naar alternatieven voor de t-toets, en er zijn sommige, maar eerst denk ik dat ik enkele variaties van de t-test moet identificeren, voor het geval je dacht dat de t-test alleen nuttig is in het scenario dat ik hierboven heb beschreven. Wanneer een t-test de betrouwbaarheid van het verschil tussen twee steekproeven meet, zoals hierboven beschreven, wordt dit een onafhankelijke steekproeven t-test genoemd. Wanneer de t-test meet de betrouwbaarheid van het verschil tussen een steekproef bij twee verschillende gelegenheden, dit wordt een Paired-Sample t-test genoemd (dus als u één groep gebruikers één keer heeft gemeten , en vervolgens dezelfde groep een week later opnieuw heeft gemeten, zou u een t-test met een gepaarde steekproef uitvoeren). En als de t-test het verschil meet tussen één steekproef en een hypothetisch gemiddelde of een bekend populatiegemiddelde (zoals wanneer we de gemiddelde dagelijkse inkomsten van een steekproef van gebruikers afgezet tegen wat we weten dat de gemiddelde dagelijkse inkomsten van onze gehele service zijn), wordt dit een One-Sample t- test.
Wat betreft alternatieven voor de t-test, de meest populaire is de Mann-Whitney U -test, die een niet-parametrische hypothese is test die goed te gebruiken is wanneer de verdeling van de steekproef en populatie niet normaal is (een zachte vereiste voor de t-toets).