Mejor respuesta
Para hacer un gráfico QQ en Excel, primero debe tener algunas cosas:
- Un conjunto de datos ordenados
- Una secuencia ordinal para clasificar los puntos de datos
- Realice el cálculo cuantílico sobre los puntos de configuración de datos
- Busque las z-scores correspondiente a los cuantiles del conjunto de datos
Esto en una ilustración de lo anterior:
- Luego, inserta un diagrama de dispersión , usando las puntuaciones z como el eje X y los puntos del conjunto de datos como el eje Y
{ Tenga en cuenta : mi versión de Excel está en español, pero el contexto es la s ame para todas las versiones de otros idiomas.}
- Después de hacer esto, tendrá un gráfico que se parece a este
- Haga clic derecho en los puntos de datos y seleccione agregar línea de tendencia opción
- Formatee el gráfico como desee
Respuesta
La gráfica QQ se usa para comparar dos distribuciones.
Usemos un ejemplo: Debajo del verde hay un histograma de 100 puntos de datos. El azul es el PDF de una distribución normal. Puede ver que el verde tiene una distribución aproximadamente normal, excepto que en el lado izquierdo, hay más valores bajos de los que debería tener.
Esto se vuelve más claro cuando traza los datos como se muestra a continuación de manera dispersa:
Los verdes son los 100 puntos de datos del histograma. El azul es el 1\%, 2\%,… 100\% cuantiles de una distribución normal. Los valores atípicos de la izquierda se vuelven más obvios a la vista en este punto. Pero aún es difícil saber qué tan cerca está la distribución verde del azul, especialmente con los datos en el medio completamente apagados. ¿Qué pasa si comparamos el punto de datos más pequeño en verde con el el punto de datos más pequeño en azul? ¿El segundo más pequeño en verde y el segundo más pequeño en azul? … y ver cuánto están fuera?
Y eso es lo que es un gráfico QQ :
Centrémonos en el punto más a la izquierda, el más bajo. En una distribución normal teórica (eje x, correspondiente a la distribución azul en el gráfico anterior), el cuantil del 1\% debería ser -2,6; en nuestra distribución de muestra (eje y, correspondiente a la distribución verde en el gráfico anterior), el cuantil del 1\% (es decir, el punto de datos más pequeño en un conjunto de datos de tamaño 100) es -3,4. Parece más bajo de lo que debería ser (por debajo de la línea de 45 grados ajustada).
Los diagramas de QQ no son muy intuitivos de leer , pero podemos desarrollar más intuición si observamos los gráficos QQ de diferentes distribuciones.
Muestras bimodales en comparación con la distribución normal:
De nuevo, pensemos en cómo transformar el distribución normal en azul a las muestras en verde: tendríamos que apretar la mitad izquierda y la mitad derecha respectivamente, y dejar el punto medio prácticamente sin cambios. Las partes que se encuentran justo a la izquierda o derecha al punto medio se adelgazan (más bajas y más altas que sus contrapartes en la distribución normal azul).
Todos estos se reflejan en la gráfica QQ:
Observe cómo el punto cercano a 0 se encuentra en la línea. El extremo izquierdo está por encima de la línea y el extremo derecho está debajo de la línea: lo que significa que las colas están menos esparcidas en las muestras que la distribución teórica. Las partes que se encuentran justo a la izquierda o derecha a 0 están por debajo y por encima de la línea, lo que significa que esos puntos se desplazan más a la izquierda y más a la derecha de la distribución teórica.
Aquí hay una gráfica para ayudar a visualizar la conexión:
Aquí hay un modelo mental para visualizar una gráfica QQ: imagina el distribución teórica en azul como 100 cuentas en una varilla. Puede empujar cada cuenta hacia la izquierda o hacia la derecha para llegar a la distribución de la muestra. Si empuja hacia la izquierda, eso significa que en una gráfica Q-Q, ese punto de datos está debajo de la línea ajustada; si empuja a la derecha, está arriba. Básicamente, gire el movimiento 90 grados en sentido antihorario
Un ejemplo más: Muestras sesgadas a la derecha en comparación con una distribución normal
Puntos izquierdos correspondientes en la distribución normal azul todos se aplastan a cerca de -1 en la distribución verde.Los puntos más a la derecha en la distribución normal azul se dibujan más a la derecha de lo que deberían. Todo esto se refleja en la gráfica QQ:
Observe cómo ambas colas son más altas que la línea de 45 grados.
Para mayor intuición, a continuación se muestran todas las muestras extraídas de una distribución normal, de varios tamaños de muestra, comparándolas con la distribución normal.
Los gráficos QQ no se limitan a distribuciones normales. Puede usarlo para comparar dos distribuciones.