ベストアンサー
- 鼻が伸びていない場合、彼は嘘をついていて、鼻は伸びますが、それから彼は言っています真実とそれは起こり得ない。
- 彼の鼻が成長している場合、彼は真実を語っているので、それは起こり得ない。
- 彼の鼻が成長するならば、彼は真実を語っているが、嘘をつくと鼻が大きくなるので、それは起こり得ない。
- 鼻が伸びない場合は、嘘をついて成長するが、真実を語るだろう。
回答
教員会議中に、9年生の教師のグループは、生徒にとって最適な学習期間をさらに理解する必要があると判断しました。満足のいく結果を達成するために。そこで、生徒が勉強していたおおよその時間を収集し、生徒のテストのスコアと比較することにしました。
Mr。シンプソンは、データが多いほど結果が良くなることを教員に確信させたため、すべての教師がコース間のデータを統合して分析しました。
結果は驚くべきものでした。誰もが混乱するように、学生が少ないほど、テストで得点が高くなる傾向があります。
実際、係数この相関関係は-0.7981であり、強い負の関係でした。
生徒に勉強を減らすように勧めるべきでしょうか?データがそのような主張をどのように裏付けているのでしょうか。確かに何かが欠けていました。
結果について話し合った後、教師は学校の統計学者であるパラドックス夫人に相談することに同意しました。シンプソン氏が結果で見つけたものをパラドックス夫人に説明した後、パラドックス夫人は各コースのデータを個別に分析することを提案しました。
そこで、彼らは先に進んで物理学を分析しました。エド。そして、彼らの心を吹き飛ばし始めました。
0.6353の相関関係!統計の世界では、これはどのようにして可能でしたか?
夫人次に、パラドックスはこれをシンプソンのパラドックスと説明しました。これは、3番目の交絡変数に導入されると、一見強い関係が逆転または消失する統計的現象です。
彼女はシンプソン氏にすべてのデータをもう一度プロットするように説得しましたが、その後、各コースを個別に色分けして、互いに区別しました。
そうした後、シンプソン氏と9年生の教員は、関係は確かに良好であり、学生が勉強する時間が長いほど、成績が高くなる傾向があると結論付けました。
含む分析の研究過程は完全に関係を逆転させました。
この例のRコード:
# Load the tidyverse
library(tidyverse)
# Generating correlated data with mvrnorm() from the MASS library
library(MASS)
# Sample Means
mu <- c(20,4)
# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3
# create both variables with 100 samples
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
# Examine the data and the correlation
head(vars)
cor(vars)
# Plot the variables
plot(vars[,1],vars[,2])
# Create a function for generating 2 correlated variables given variable means
corVars<-function(m1,m2,confVar){
mu <- c(m1,m2)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
Var1<-vars[,1]
Var2<-vars[,2]
df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))
df$Var1<-as.numeric(as.character(df$Var1))
df$Var2<-as.numeric(as.character(df$Var2))
}
# Re-running for multiple sets and combining into a single dataframe df
d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")
d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")
d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")
d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")
d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")
# Create the aggregate data
df<-rbind(d1,d2,d3,d4,d5)
# Grade & Study Time Plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# Grade & Study Time Correlation
cor(df$Var1, df$Var2)
# PhysEd Plot
df \%>\%
filter(Var3 == "Physical Education") \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# PhysEd Correlation
cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])
# Confounding plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +
guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),
size = FALSE) +
scale\_y\_continuous(name = "Testing Results", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()