Bästa svaret
För att skapa en QQ-plot i Excel måste du ha några saker först:
- En sorterad datamängd
- En ordningsföljd för att rangordna datapunkterna
- Utför kvantitetsberäkningen över datamängderna
- Hitta z-poäng motsvarande kvantiteterna i datamängden
Detta i en illustration av ovan nämnda:
- Sedan infogar du en spridningsdiagram med z-poängen som X-axel och datamängderna som Y-axel
{ Observera : min Excel-version är på spanska, men sammanhanget är ame för alla andra språkversioner.}
- När du har gjort detta kommer du att ha ett diagram som liknar detta
- Högerklicka på datapunkterna och välj lägg till trendlinje alternativ
- Formatera plot som önskat
Svar
QQ-plot används för att jämföra två distributioner.
Låt oss använda ett exempel: Under grön är en histogram med 100 datapunkter. Blå är PDF-filen för en normal distribution. Du kan se att grönt är ungefär normalt fördelat, förutom att det finns fler låga värden på vänster sida.
Detta blir tydligare när du plottar upp data som nedan på ett spridd sätt:
Gröna är de 100 datapunkter från histogrammet. Blå är 1\%, 2\%, … 100\% kvantiteter av en normalfördelning. Avvikelserna till vänster blir tydligare för ögonkulan vid denna tidpunkt. Men det är fortfarande svårt att säga hur nära den gröna fördelningen är blå, speciellt med data i mitten som alla är dämpade. Vad händer om vi jämför den minsta datapunkten i grönt med minsta datapunkt i blått? Näst minsta i grönt med näst minsta i blått? … Och se hur mycket de är ute?
Och det är vad en QQ-plot är :
Låt oss fokusera på den vänstra, lägsta punkten. I en teoretisk normalfördelning (x-axeln, motsvarande den blå fördelningen i föregående diagram), bör 1\% -kvantilen vara -2,6; i vår provfördelning (y-axel, motsvarande den gröna fördelningen i föregående diagram), är 1\% -kvantilen (dvs. den minsta datapunkten i en datamängd med storlek 100) -3,4. Det verkar vara lägre än det borde vara (under den monterade 45 graderslinjen).
QQ-diagram är inte särskilt intuitiva att läsa , men vi kan bygga mer intuition genom att titta på QQ-diagram över olika distributioner.
Bimodala prover jämfört med normalfördelning:
Återigen, låt oss fundera över hur vi kan omvandla normalfördelning i blått till proverna i grönt: vi skulle behöva pressa den vänstra halvan respektive högerhalvan och lämna mittpunkten ungefär oförändrad. Delar som bara är vänster till eller höger till mittpunkten tunnas ut (lägre och högre än motsvarigheterna i den blå normalfördelningen).
Dessa återspeglas alla i QQ-plot:
Observera hur punkten nära 0 ligger på linjen. Längst till vänster är över linjen och längst till höger är under linjen: det betyder att svansarna är mindre spridda i proverna än den teoretiska fördelningen. Delar som bara är vänster till eller höger till 0 är under och ovanför linjen, vilket innebär att dessa punkter skjuts till vänster och till höger från den teoretiska fördelningen.
Här är en plot för att visualisera anslutningen:
Här är en mental modell för att visualisera en QQ-plot: föreställ dig teoretisk fördelning i blått som 100 pärlor på en stav. Du kan trycka varje pärla åt vänster eller höger för att komma till provfördelningen. Om du trycker åt vänster, betyder det i en Q-Q-plot att datapunkten ligger under den monterade linjen; om du trycker åt höger är det ovanför. Rotera i grund och botten rörelsen moturs med 90 grader
Ytterligare ett exempel: Höger snedställda prover jämfört med en normalfördelning
Motsvarande vänstra punkter i den blå normalfördelningen alla kläms till nästan -1 i den gröna fördelningen.De högsta punkterna i den blå normalfördelningen dras längre till höger än de borde vara. Allt detta återspeglas i QQ-plot:
Lägg märke till hur båda svansarna är högre än 45 graders linjen.
För mer intuition, nedan visas alla prover från en normalfördelning, med olika provstorlek, jämfört med normalfördelningen.
QQ-diagram är inte begränsade till normala fördelningar. Du kan använda den för att jämföra två distributioner.