Beste Antwort
- Wenn seine Nase nicht wächst, lügt er und seine Nase wächst, aber dann erzählt er die Wahrheit und es kann nicht passieren.
- Wenn seine Nase wächst, sagt er die Wahrheit, also kann es nicht passieren.
- Wenn seine Nase wächst, wird er es tun Sag die Wahrheit, aber seine Nase wächst, wenn er lügt, damit es nicht passieren kann.
- Wenn seine Nase nicht wächst, lügt er und sie wächst, aber dann würde er die Wahrheit sagen, damit es so ist kann nicht passieren.
Antwort
Während eines Fakultätsmeetings entschied eine Gruppe von Lehrern der 9. Klasse, dass sie besser verstehen müssen, wie die optimale Studiendauer für die Schüler ist zufriedenstellende Ergebnisse zu erzielen. Also beschlossen sie, die ungefähre Anzahl der Stunden, die die Schüler studierten, zu erfassen und dann mit den Testergebnissen der Schüler zu vergleichen.
Mr. Simpson überzeugte die Fakultät davon, dass mehr Daten bessere Ergebnisse bedeuten, und so haben alle Lehrer ihre kursübergreifenden Daten für die Analyse integriert.
Die Ergebnisse waren erstaunlich. Zur Verwirrung aller, je weniger ein Schüler studierte, desto höher ist seine Punktzahl bei Tests.
Tatsächlich ist der Koeffizient Mit dieser Korrelation war -0,7981 verbunden, eine stark negative Beziehung.
Sollten sie ihre Schüler ermutigen, weniger zu lernen? Wie in aller Welt könnten Daten eine solche Behauptung stützen? Sicherlich fehlte etwas.
Nach Erörterung der Ergebnisse waren sich die Lehrer einig, dass sie die Statistikerin der Schule, Frau Paradox, konsultieren sollten. Nachdem Herr Simpson Frau Paradox erklärt hatte, was sie in ihren Ergebnissen gefunden hatten, schlug Frau Paradox vor, die Daten jedes Kurses einzeln zu analysieren.
Also gingen sie voran und analysierten Phys. Ed. und fuhr fort, ihre Gedanken geblasen zu haben.
Eine Korrelation von 0,6353! Wie im statistischen Universum war das überhaupt möglich?
Mrs. Paradox erklärte dies dann als Simpsons Paradoxon, ein statistisches Phänomen, bei dem sich eine scheinbar starke Beziehung umkehrt oder verschwindet, wenn sie in eine dritte verwirrende Variable eingeführt wird.
Sie überzeugte Herrn Simpson, alle Daten noch einmal zu zeichnen, dann aber jeden Kurs einzeln farblich zu kennzeichnen, um sie voneinander zu unterscheiden.
Danach kamen Herr Simpson und die Fakultät der 9. Klasse zu dem Schluss, dass die Beziehung tatsächlich positiv war und dass die Note umso höher ist, je mehr Stunden ein Schüler studierte.
Einschließlich Der Studienverlauf in der Analyse kehrte die Beziehung vollständig um.
R Code für dieses Beispiel:
# Load the tidyverse
library(tidyverse)
# Generating correlated data with mvrnorm() from the MASS library
library(MASS)
# Sample Means
mu <- c(20,4)
# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3
# create both variables with 100 samples
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
# Examine the data and the correlation
head(vars)
cor(vars)
# Plot the variables
plot(vars[,1],vars[,2])
# Create a function for generating 2 correlated variables given variable means
corVars<-function(m1,m2,confVar){
mu <- c(m1,m2)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
Var1<-vars[,1]
Var2<-vars[,2]
df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))
df$Var1<-as.numeric(as.character(df$Var1))
df$Var2<-as.numeric(as.character(df$Var2))
}
# Re-running for multiple sets and combining into a single dataframe df
d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")
d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")
d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")
d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")
d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")
# Create the aggregate data
df<-rbind(d1,d2,d3,d4,d5)
# Grade & Study Time Plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# Grade & Study Time Correlation
cor(df$Var1, df$Var2)
# PhysEd Plot
df \%>\%
filter(Var3 == "Physical Education") \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# PhysEd Correlation
cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])
# Confounding plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +
guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),
size = FALSE) +
scale\_y\_continuous(name = "Testing Results", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()