Paras vastaus
- Jos nenä ei kasva, hän valehtelee ja nenä kasvaa, mutta sitten hän kertoo totuus ja sitä ei voi tapahtua.
- Jos hänen nenänsä kasvaa, hän kertoo totuuden, joten sitä ei voi tapahtua.
- Jos nenä kasvaa, hän kertoa totuutta, mutta hänen nenänsä kasvaa, jos hän valehtelee, jotta sitä ei voi tapahtua.
- Jos hänen nenänsä ei kasva, hän valehtelee ja se kasvaa, mutta sitten hän puhuisi totuutta niin ei voi tapahtua.
Vastaus
Tiedekunnan kokouksessa ryhmä 9. luokan opettajia päätti, että heidän oli ymmärrettävä tarkemmin, mikä opintojen optimaalinen kesto on opiskelijoille tyydyttävien tulosten saavuttamiseksi. Joten he päättivät kerätä arvioidun määrän opiskelijoiden opiskelemia tunteja ja verrata sitten opiskelijan testituloksiin.
Mr. Simpson vakuutti tiedekunnan siitä, että enemmän tietoa tarkoittaa parempia tuloksia, joten kaikki opettajat integroivat kurssien väliset tiedot analyysiin.
Tulokset olivat hämmästyttäviä. Kaikkien hämmennykseksi, mitä vähemmän opiskelija opiskeli, sitä korkeammat heillä on pisteet pisteissä.
Itse asiassa kerroin Tähän korrelaatioon liittyi -0,7981, voimakkaasti negatiivinen suhde.
Pitäisikö heidän kannustaa opiskelijoitaan opiskelemaan vähemmän? Kuinka tiedot voisivat maailmassa tukea tällaista väitettä? Jotakin puuttui varmasti.
Tuloksista keskusteltuaan opettajat sopivat kuulevansa koulun tilastotieteilijää, rouva Paradoxia. Kun herra Simpson selitti rouva Paradoxille, mitä he olivat löytäneet tuloksistaan, rouva Paradox ehdotti, että he analysoivat kunkin kurssin tiedot erikseen.
Joten he jatkoivat ja analysoivat Phys. Toim. ja jatkoi mielensä räjäyttämistä.
Korrelaatio 0,6353! Kuinka tilastollisessa maailmankaikkeudessa tämä oli edes mahdollista?
Mrs. Paradox selitti tämän sitten Simpsonin paradoksi, tilastollinen ilmiö, jossa näennäisesti vahva suhde kääntyy tai katoaa, kun se otetaan käyttöön kolmanteen sekoittavaan muuttujaan.
Hän vakuutti herra Simpsonin piirtämään kaikki tiedot uudelleen, mutta sitten värikoodaamaan kaikki kurssit erikseen erottaakseen ne toisistaan.
Sen jälkeen herra Simpson ja 9. luokan tiedekunta päättelivät, että suhde oli todellakin positiivinen ja että mitä enemmän tunteja opiskelija opiskeli, sitä korkeampi palkkaluokka on.
Sisältää analyysin opintojen kulku käänsi täysin suhteen.
R Tämän esimerkin koodi:
# Load the tidyverse
library(tidyverse)
# Generating correlated data with mvrnorm() from the MASS library
library(MASS)
# Sample Means
mu <- c(20,4)
# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3
# create both variables with 100 samples
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
# Examine the data and the correlation
head(vars)
cor(vars)
# Plot the variables
plot(vars[,1],vars[,2])
# Create a function for generating 2 correlated variables given variable means
corVars<-function(m1,m2,confVar){
mu <- c(m1,m2)
Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5
vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)
Var1<-vars[,1]
Var2<-vars[,2]
df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))
df$Var1<-as.numeric(as.character(df$Var1))
df$Var2<-as.numeric(as.character(df$Var2))
}
# Re-running for multiple sets and combining into a single dataframe df
d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")
d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")
d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")
d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")
d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")
# Create the aggregate data
df<-rbind(d1,d2,d3,d4,d5)
# Grade & Study Time Plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# Grade & Study Time Correlation
cor(df$Var1, df$Var2)
# PhysEd Plot
df \%>\%
filter(Var3 == "Physical Education") \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +
scale\_y\_continuous(name = "Final Percentage", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
guides(size = FALSE) +
ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()
# PhysEd Correlation
cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])
# Confounding plot
df \%>\%
ggplot(aes(x = Var1, y = Var2/100)) +
geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +
guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),
size = FALSE) +
scale\_y\_continuous(name = "Testing Results", labels = percent)+
scale\_x\_continuous(name = "Approximate Hours for Preparation")+
ggtitle("Impact of Studying on Final Grades")+
theme(plot.title = element\_text(hjust = 0.5))+
theme\_bw()