Hoe maak je een QQ-plot in Excel


Beste antwoord

Om een ​​ QQ-plot te maken in Excel moet u eerst een aantal dingen hebben:

  • Een gesorteerde gegevensset
  • Een rangschikking om de gegevenspunten te rangschikken
  • Voer de kwantielberekening uit over de datasetpunten
  • Vind de z-scores corresponderend met de kwantielen van de dataset

Dit in een illustratie van het bovenstaande:

  • Vervolgens voegt u een spreidingsplot in met behulp van de z-scores als de X-as en de datasetpunten als de Y-as

{ Let op : mijn Excel-versie is in het Spaans, maar de context is de s ame voor alle andere taalversies.}

  • Nadat je dit hebt gedaan, heb je een grafiek die hierop lijkt

  • Klik met de rechtermuisknop op de datapunten en selecteer de trendlijn toevoegen optie
  • Formatteer de plot zoals gewenst

Antwoord

QQ-plot wordt gebruikt om twee distributies te vergelijken.

Laten we een voorbeeld gebruiken: Onder groen is een histogram van 100 gegevenspunten. Blauw is de pdf van een normale distributie. Je kunt zien dat groen ruwweg normaal verdeeld is, behalve dat er aan de linkerkant meer lage waarden zijn dan zou moeten.

Dit wordt duidelijker wanneer u de gegevens zoals hieronder op een verspreide manier uitzet:

Groen zijn de 100 gegevenspunten uit het histogram. Blauw is de 1\%, 2\%, … 100\% kwantielen van een normale verdeling. De uitschieters aan de linkerkant worden op dit punt duidelijker voor de oogbal. Maar het is nog steeds moeilijk te zeggen hoe dicht de groene verdeling bij blauw is, vooral als de gegevens in het midden allemaal gedempt zijn. Wat als we het kleinste gegevenspunt in het groen vergelijken met de kleinste datapunt in blauw? Op één na kleinste in groen met op één na kleinste in blauw? … En kijk hoeveel ze af zijn?

En dat is wat een QQ-plot is :

Laten we ons concentreren op het meest linkse, laagste punt. In een theoretische normale verdeling (x-as, overeenkomend met de blauwverdeling in de vorige grafiek), moet het 1\% -kwantiel -2,6 zijn; in onze steekproefverdeling (y-as, overeenkomend met de groene verdeling in de vorige plot), is het 1\% kwantiel (d.w.z. het kleinste gegevenspunt in een gegevensset van 100) -3,4. Het lijkt lager dan het zou moeten zijn (onder de gemonteerde lijn van 45 graden).

QQ-plots zijn niet erg intuïtief om te lezen , maar we kunnen meer intuïtie opbouwen door te kijken naar QQ-plots van verschillende distributies.

Bimodale monsters in vergelijking met normale distributie:

Laten we nogmaals nadenken over hoe we de normale verdeling in blauw naar de monsters in groen: we zouden respectievelijk de linkerhelft en de rechterhelft moeten samenknijpen en het middelpunt ongeveer ongewijzigd laten. Delen net links naar of rechts naar het middelpunt worden uitgedund (lager en hoger dan hun tegenhangers in de blauwe normale verdeling).

Deze worden allemaal weerspiegeld in de QQ-plot:

Merk op hoe het punt nabij 0 op de lijn ligt. Helemaal links is boven de lijn en uiterst rechts onder de lijn: wat betekent dat de staarten minder verspreid zijn in de monsters dan de theoretische verdeling. Delen net van links naar of van rechts naar 0 zijn onder en boven de lijn, wat betekent dat die punten verder naar links en verder naar rechts worden geduwd vanaf de theoretische verdeling.

Hier is een plot om de verbinding te helpen visualiseren:

Hier is een mentaal model om een ​​QQ-plot te visualiseren: stel je de theoretische verdeling in blauw als 100 kralen op een staaf. U kunt elke kraal naar links of rechts duwen om bij de monsterdistributie te komen. Als u naar links duwt, betekent dit dat in een Q-Q-plot dat datapunt onder de passende lijn ligt; als je naar rechts duwt, is het boven. Draai de beweging in feite 90 graden tegen de klok in

Nog een voorbeeld: Rechts scheve monsters vergeleken met een normale verdeling

Overeenkomstige linkerpunten in de blauwe normale verdeling ze worden allemaal platgedrukt tot bijna -1 in de groene distributie.De meest rechtse punten in de blauwe normale verdeling worden verder naar rechts getekend dan ze zouden moeten zijn. Dit wordt allemaal weerspiegeld in de QQ-plot:

Merk op hoe beide staarten hoger zijn dan de 45 graden lijn.

Voor meer intuïtie, hieronder zijn alle steekproeven getrokken uit een normale verdeling, van verschillende steekproefomvang, vergeleken met de normale verdeling.

QQ-plots zijn niet beperkt tot normale distributies. U kunt het gebruiken om twee willekeurige distributies te vergelijken.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *