Melhor resposta
Para fazer um gráfico QQ em Excel, você precisa ter algumas coisas primeiro:
- Um conjunto de dados classificado
- Uma sequência ordinal para classificar os pontos de dados
- Execute o cálculo do quantil sobre os pontos do conjunto de dados
- Encontre os z-scores correspondendo aos quantis do conjunto de dados
Isso em uma ilustração do mencionado acima:
- Em seguida, você insere um gráfico de dispersão , usando os z-scores como o eixo X e os pontos do conjunto de dados como o Eixo Y
{ Observe : minha versão do Excel está em espanhol, mas o contexto é o s ame para todas as versões de outros idiomas.}
- Depois de fazer isso, você terá um gráfico semelhante a este
- Clique com o botão direito nos pontos de dados e selecione adicionar linha de tendência opção
- Formate o gráfico conforme desejado
Resposta
O gráfico QQ é usado para comparar duas distribuições.
Vamos usar um exemplo: Abaixo do verde está um histograma de 100 pontos de dados. Azul é o PDF de uma distribuição normal. Você pode ver que o verde é quase normalmente distribuído, exceto que no lado esquerdo, há mais valores baixos do que deveria.
Isso se torna mais claro quando você representa os dados como abaixo de uma maneira dispersa:
Os verdes são os 100 pontos de dados do histograma. Azul são os quantis de 1\%, 2\%,… 100\% de uma distribuição normal. Os outliers à esquerda tornam-se mais óbvios para a bola do olho neste ponto. Mas ainda é difícil dizer o quão próxima a distribuição verde está do azul, especialmente com os dados no meio todos abafados. E se compararmos o menor ponto de dados em verde com o menor ponto de dados em azul? O segundo menor em verde com o segundo menor em azul? … E ver quanto eles estão errados?
E isso é o que é um gráfico QQ :
Vamos nos concentrar no ponto mais à esquerda, mais baixo. Em uma distribuição normal teórica (eixo x, correspondendo à distribuição em azul no gráfico anterior), o quantil de 1\% deve ser -2,6; em nossa distribuição de amostra (eixo y, correspondendo à distribuição verde no gráfico anterior), o quantil de 1\% (ou seja, o menor ponto de dados em um conjunto de dados de tamanho 100) é -3,4. Parece mais baixo do que deveria (abaixo da linha de 45 graus ajustada).
Os gráficos QQ não são muito intuitivos de ler , mas podemos construir mais intuição observando gráficos QQ de distribuições diferentes.
Amostras bimodais em comparação com a distribuição normal:
Novamente, vamos pensar sobre como transformar o distribuição normal em azul para as amostras em verde: precisaríamos apertar a metade esquerda e a metade direita, respectivamente, e deixar o ponto do meio praticamente inalterado. As partes apenas da esquerda ou da direita para o ponto médio são diluídas (mais baixas e mais altas do que suas contrapartes na distribuição normal azul).
Tudo isso está refletido no gráfico QQ:
Observe como o ponto próximo a 0 está na linha. A extrema esquerda está acima da linha e a extrema direita abaixo da linha: o que significa que as caudas estão menos espalhadas nas amostras do que a distribuição teórica. As partes logo da esquerda ou da direita para 0 estão abaixo e acima da linha, o que significa que esses pontos são empurrados para a esquerda e para a direita a partir da distribuição teórica.
Aqui está um gráfico para ajudar a visualizar a conexão:
Aqui está um modelo mental para visualizar um gráfico QQ: imagine o distribuição teórica em azul como 100 contas em uma haste. Você pode empurrar cada conta para a esquerda ou direita para obter a distribuição da amostra. Se você empurrar para a esquerda, isso significa que em um gráfico Q-Q, esse ponto de dados está abaixo da linha ajustada; se você empurrar para a direita, está acima. Basicamente, gire o movimento no sentido anti-horário em 90 graus
Mais um exemplo: Amostras distorcidas para a direita em comparação com uma distribuição normal
Pontos à esquerda correspondentes na distribuição normal azul todos são comprimidos para perto de -1 na distribuição verde.Os pontos mais à direita na distribuição normal azul são desenhados mais à direita do que deveriam. Tudo isso se reflete no gráfico QQ:
Observe como ambas as caudas são mais altas do que a linha de 45 graus.
Para mais intuição, abaixo estão todas as amostras retiradas de uma distribuição normal, de vários tamanhos de amostra, comparando com a distribuição normal.
Os gráficos QQ não se limitam a distribuições normais. Você pode usá-lo para comparar quaisquer duas distribuições.