¿Qué es la paradoja de Pinocho?


La mejor respuesta

  • Si su nariz no crece, está diciendo una mentira y su nariz crecerá, pero entonces está diciendo la verdad y no puede suceder.
  • Si su nariz está creciendo, él está diciendo la verdad, entonces no puede suceder.
  • Si su nariz crece, él estar diciendo la verdad, pero su nariz crece si miente por lo que no puede suceder.
  • Si su nariz no crece, está mintiendo y crecerá, pero entonces estaría diciendo la verdad así que no puede suceder.

Responder

Durante una reunión de profesores, un grupo de maestros de noveno grado decidió que necesitaban comprender mejor cuál es la duración óptima del estudio para los estudiantes para lograr resultados satisfactorios. Por lo tanto, decidieron recopilar la cantidad aproximada de horas que los estudiantes estaban estudiando y luego comparar con los puntajes de las pruebas de los estudiantes.

Sr. Simpson convenció a los profesores de que más datos significan mejores resultados, por lo que todos los profesores integraron sus datos de cursos cruzados para el análisis.

Los resultados fueron asombrosos. Para confusión de todos, cuanto menos estudió un estudiante, más alto tienden a obtener puntajes en las pruebas.

De hecho, el coeficiente asociado con esta correlación fue -0,7981, una relación fuertemente negativa.

¿Deberían animar a sus estudiantes a estudiar menos? ¿Cómo diablos podrían los datos respaldar tal afirmación? Seguramente faltaba algo.

Después de discutir los resultados, los maestros acordaron que deberían consultar a la estadística de la escuela, la Sra. Paradox. Después de que el Sr. Simpson le explicó a la Sra. Paradox lo que habían encontrado en sus resultados, la Sra. Paradox sugirió que analizaran los datos de cada curso individualmente.

Entonces, siguieron adelante y analizaron Phys. Ed. y procedieron a dejarles volar la cabeza.

¡Una correlación de 0,6353! ¿Cómo en el universo estadístico fue esto posible?

Mrs. Paradox luego explicó esto como La paradoja de Simpson, un fenómeno estadístico en el que una relación aparentemente fuerte se invierte o desaparece cuando se introduce una tercera variable de confusión.

Ella convenció al Sr. Simpson para que graficara todos los datos una vez más, pero luego codifique con colores cada curso por separado para distinguirlos entre sí.

Después de hacerlo, el Sr. Simpson y el cuerpo docente del noveno grado concluyeron que la relación era realmente positiva y que cuantas más horas estudiaba un estudiante, más alta tiende a ser la calificación.

Incluyendo el curso de estudio en el análisis invirtió completamente la relación.

Código R para este ejemplo:

# Load the tidyverse

library(tidyverse)

# Generating correlated data with mvrnorm() from the MASS library

library(MASS)

# Sample Means

mu <- c(20,4)

# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3

# create both variables with 100 samples

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

# Examine the data and the correlation

head(vars)

cor(vars)

# Plot the variables

plot(vars[,1],vars[,2])

# Create a function for generating 2 correlated variables given variable means

corVars<-function(m1,m2,confVar){

mu <- c(m1,m2)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

Var1<-vars[,1]

Var2<-vars[,2]

df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))

df$Var1<-as.numeric(as.character(df$Var1))

df$Var2<-as.numeric(as.character(df$Var2))

}

# Re-running for multiple sets and combining into a single dataframe df

d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")

d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")

d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")

d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")

d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")

# Create the aggregate data

df<-rbind(d1,d2,d3,d4,d5)

# Grade & Study Time Plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# Grade & Study Time Correlation

cor(df$Var1, df$Var2)

# PhysEd Plot

df \%>\%

filter(Var3 == "Physical Education") \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# PhysEd Correlation

cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])

# Confounding plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +

guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),

size = FALSE) +

scale\_y\_continuous(name = "Testing Results", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *