Nejlepší odpověď
Chcete-li vytvořit graf QQ v V Excelu musíte mít nejprve nějaké věci:
- Setříděná datová sada
- Pořadová posloupnost pro seřazení datových bodů
- Proveďte výpočet kvantilu body sady dat
- Najděte z-skóre odpovídající kvantilům souboru dat
Na ilustraci výše uvedeného:
- Potom vložíte bodový graf pomocí skóre z jako osa X a soubor dat ukazuje jako osa Y
{ Upozornění : moje verze aplikace Excel je ve španělštině, ale kontext je ame pro všechny ostatní jazykové verze.}
- Poté budete mít graf, který se tomuto podobá
- Klikněte pravým tlačítkem na datové body a vyberte přidat trendovou čáru možnost
- Naformátujte graf podle potřeby
Odpověď
K porovnání dvou distribucí se používá graf QQ.
Použijme příklad: Pod zelenou je histogram 100 datových bodů. Modrá je PDF normální distribuce. Vidíte, že zelená je zhruba normálně distribuovaná, kromě toho, že na levé straně je více nízkých hodnot, než by mělo mít.
To bude jasnější, když vykreslíte níže uvedená data rozptýleným způsobem:
Zelená jsou 100 datových bodů z histogramu. Modrá je 1\%, 2\%,… 100\% kvantil normální distribuce. Odlehlé hodnoty nalevo se v tomto okamžiku stávají očividnějšími. Stále je ale těžké říct, jak blízko je zelené rozdělení k modré, zvláště když jsou data uprostřed ztlumená. Co když porovnáme nejmenší zelený datový bod s nejmenší modře datový bod? Druhý nejmenší v zelené barvě s druhým nejmenším v modré barvě? … A uvidíte, jak moc jsou vypnuté?
A to je to, co je QQ spiknutí :
Zaměřme se na levý nejvíce, nejnižší bod. V teoretickém normálním rozdělení (osa x, odpovídající modré distribuci v předchozím grafu) by měl být 1\% kvantil -2,6; v naší distribuci vzorku (osa y, která odpovídá zelené distribuci v předchozím grafu) je 1\% kvantil (tj. nejmenší datový bod v datové sadě o velikosti 100) -3,4. Zdá se, že je nižší, než by měl být (pod upravenou 45stupňovou čarou).
Čtení QQ není příliš intuitivní ke čtení , ale více intuice můžeme vytvořit, když se podíváme na grafy QQ různých distribucí.
Bimodální vzorky ve srovnání s normální distribucí:
Znovu se zamyslíme nad tím, jak transformovat normální rozdělení modře k vzorkům zeleně: museli bychom stlačit levou polovinu, respektive pravou polovinu, a ponechat prostřední bod zhruba beze změny. Části zleva doprava nebo doprava do středního bodu jsou zeslabeny (nižší a vyšší než jejich protějšky v modrém normálním rozdělení).
To vše se odráží v grafu QQ:
Všimněte si, jak leží bod blízko 0 na přímce. Zcela vlevo jsou nad čarou a zcela vpravo jsou pod čarou: což znamená, že ocasy jsou ve vzorcích rozprostřeny méně než teoretické rozdělení. Části zleva nebo zprava na 0 jsou pod a nad čarou, což znamená, že tyto body jsou posunuty z teoretického rozdělení dále doleva a doprava.
Zde je graf, který pomáhá vizualizovat spojení:
Zde je mentální model pro vizualizaci QQ spiknutí: představte si teoretické rozdělení v modré barvě jako 100 kuliček na tyči. Můžete posunout každý korálek doleva nebo doprava, abyste se dostali k distribuci vzorků. Pokud zatlačíte doleva, znamená to, že v grafu Q-Q je tento datový bod pod vloženou čarou; pokud zatlačíte doprava, je to výše. V zásadě otočit pohyb proti směru hodinových ručiček o 90 stupňů
Ještě jeden příklad: Pravoúhlé vzorky ve srovnání s normální distribucí
Odpovídající levé body v modrém normálním rozdělení všechny jsou rozmačkané na téměř -1 v zelené distribuci.Body zcela vpravo v modré normální distribuci se vykreslí dále vpravo, než by měly být. To vše se odráží v grafu QQ:
Všimněte si, jak jsou oba ocasy vyšší než 45 stupňů.
Pro větší intuici jsou níže uvedeny všechny vzorky odebrané z normální distribuce různé velikosti vzorku ve srovnání s normální distribucí.
Grafy QQ nejsou omezeny na normální distribuce. Můžete jej použít k porovnání libovolných dvou distribucí.