Qual é o paradoxo do Pinóquio?


Melhor resposta

  • Se seu nariz não está crescendo, ele está mentindo e seu nariz vai crescer, mas então ele está contando a verdade e isso não pode acontecer.
  • Se seu nariz está crescendo, ele está dizendo a verdade, então isso não pode acontecer.
  • Se seu nariz crescer, ele irá estar falando a verdade, mas seu nariz cresce se ele mentir, então isso não pode acontecer.
  • Se seu nariz não crescer, ele está mentindo e vai crescer, mas então ele estaria dizendo a verdade, então não pode acontecer.

Resposta

Durante uma reunião do corpo docente, um grupo de professores da 9ª série decidiu que precisava entender melhor qual é a duração ideal de estudo para os alunos para obter resultados satisfatórios. Então, eles decidiram reunir o número aproximado de horas que os alunos estavam estudando e, em seguida, comparar com as pontuações dos testes dos alunos.

Sr. Simpson convenceu o corpo docente de que mais dados significam melhores resultados e, portanto, todos os professores integraram seus dados de vários cursos para a análise.

Os resultados foram surpreendentes. Para confusão de todos, quanto menos o aluno estuda, mais ele tende a pontuar nos testes.

Na verdade, o coeficiente associado a essa correlação foi -0,7981, uma relação fortemente negativa.

Eles deveriam encorajar seus alunos a estudar menos? Como no mundo os dados poderiam estar apoiando tal afirmação? Certamente faltava algo.

Depois de discutir os resultados, os professores concordaram que deveriam consultar a estatística da escola, a Sra. Paradoxo. Depois que o Sr. Simpson explicou à Sra. Paradox o que eles encontraram em seus resultados, a Sra. Paradoxo sugeriu que analisassem os dados de cada curso individualmente.

Então, eles foram em frente e analisaram o Phys. Ed. e começou a ter suas mentes explodidas.

Uma correlação de 0,6353! Como no universo estatístico isso era possível?

Sra. O Paradoxo então explicou isso como Paradoxo de Simpson, um fenômeno estatístico em que uma relação aparentemente forte se reverte ou desaparece quando introduzida em uma terceira variável de confusão.

Ela convenceu o Sr. Simpson a representar graficamente todos os dados mais uma vez, mas depois codifique com cores cada curso separadamente para distingui-los.

Depois de fazer isso, o Sr. Simpson e o corpo docente da 9ª série concluíram que a relação era realmente positiva e que quanto mais horas um aluno estudou, maior tende a ser a nota.

Incluindo o curso do estudo na análise inverteu completamente a relação.

Código R para este exemplo:

# Load the tidyverse

library(tidyverse)

# Generating correlated data with mvrnorm() from the MASS library

library(MASS)

# Sample Means

mu <- c(20,4)

# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3

# create both variables with 100 samples

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

# Examine the data and the correlation

head(vars)

cor(vars)

# Plot the variables

plot(vars[,1],vars[,2])

# Create a function for generating 2 correlated variables given variable means

corVars<-function(m1,m2,confVar){

mu <- c(m1,m2)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

Var1<-vars[,1]

Var2<-vars[,2]

df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))

df$Var1<-as.numeric(as.character(df$Var1))

df$Var2<-as.numeric(as.character(df$Var2))

}

# Re-running for multiple sets and combining into a single dataframe df

d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")

d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")

d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")

d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")

d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")

# Create the aggregate data

df<-rbind(d1,d2,d3,d4,d5)

# Grade & Study Time Plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# Grade & Study Time Correlation

cor(df$Var1, df$Var2)

# PhysEd Plot

df \%>\%

filter(Var3 == "Physical Education") \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# PhysEd Correlation

cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])

# Confounding plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +

guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),

size = FALSE) +

scale\_y\_continuous(name = "Testing Results", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *