Mi a Pinokkió paradoxon?


A legjobb válasz

  • Ha az orra nem növekszik, akkor hazugságot mond, és orra megnő, de akkor mondja az igazság és ez nem történhet meg.
  • Ha az orra növekszik, akkor igazat mond, így ez nem történhet meg.
  • Ha az orra megnő, akkor igazat mondani, de az orra nő, ha hazudik, így ez nem történhet meg.
  • Ha az orra nem fog növekedni, akkor hazudik és nőni fog, de akkor igazat mondana nem történhet meg.

Válasz

A tantestületi értekezlet során a 9. osztályos tanárok egy csoportja úgy döntött, hogy meg kell érteniük, mi az optimális tanulmányi idő a diákok számára kielégítő eredmények elérése érdekében. Tehát úgy döntöttek, hogy összegyűjtik a hallgatók hozzávetőleges óraszámát, majd összehasonlítják a hallgató tesztjeivel.

Mr. Simpson meggyőzte a tantestületet arról, hogy a több adat jobb eredményeket jelent, ezért az összes tanár integrálta a tanfolyamokon átívelő adatait az elemzéshez. Mindenki zavartsága szerint minél kevesebbet tanult egy diák, annál magasabb pontszámot érnek el a teszteken.

Valójában az együttható Ehhez a korrelációhoz -0,7981 volt kötve, ami erősen negatív kapcsolat volt.

Ösztönözzék-e diákjaikat a kevesebb tanulásra? Hogyan támasztják alá a világon az adatok egy ilyen állítást? Biztosan hiányzott valami.

Az eredmények megbeszélése után a tanárok megállapodtak abban, hogy konzultálniuk kell az iskola statisztikájával, Mrs. Paradox-szal. Miután Mr. Simpson elmagyarázta Mrs. Paradoxnak, hogy mit találtak eredményeikben, Mrs. Paradox azt javasolta, elemezzék külön-külön az egyes tanfolyamok adatait.

Tehát folytatták és elemezték a Phys-et. Ed. és folytatták az elméjük lefújását.

0,6353 korreláció! Hogy is volt ez a statisztikai univerzumban?

Mrs. Ezután a Paradox Simpson paradoxonaként magyarázta ezt a statisztikai jelenséget, ahol egy látszólag erős kapcsolat megfordul vagy eltűnik, ha egy harmadik zavaró változóhoz vezetjük be. Meggyőzte Mr. Simpsont, hogy az összes adatot még egyszer ábrázolja, de azután minden kurzust külön kódoljon, hogy megkülönböztesse őket egymástól.

Ezt követően Mr. Simpson és a 9. osztály oktatói arra a következtetésre jutottak, hogy a kapcsolat valóban pozitív volt, és minél több órát tanult egy diák, annál magasabb volt az érdemjegy.

Beleértve az elemzésben szereplő tanulmányi menet teljesen megfordította a kapcsolatot.

R Kód ehhez a példához:

# Load the tidyverse

library(tidyverse)

# Generating correlated data with mvrnorm() from the MASS library

library(MASS)

# Sample Means

mu <- c(20,4)

# Define our covariance matrix, and specify the covariance relationship (i.e. 0.7 in this case)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.3

# create both variables with 100 samples

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

# Examine the data and the correlation

head(vars)

cor(vars)

# Plot the variables

plot(vars[,1],vars[,2])

# Create a function for generating 2 correlated variables given variable means

corVars<-function(m1,m2,confVar){

mu <- c(m1,m2)

Sigma <- matrix(.7, nrow=2, ncol=2) + diag(2)*.5

vars <- mvrnorm(n=100, mu=mu, Sigma=Sigma)

Var1<-vars[,1]

Var2<-vars[,2]

df<-as.data.frame(cbind(Var1 = Var1,Var2 = Var2,Var3 = confVar))

df$Var1<-as.numeric(as.character(df$Var1))

df$Var2<-as.numeric(as.character(df$Var2))

}

# Re-running for multiple sets and combining into a single dataframe df

d1 <- corVars(m1 = 20, m2 = 82, confVar = "Algebra")

d2 <- corVars(m1 = 18, m2 = 84, confVar = "English")

d3 <- corVars(m1 = 16, m2 = 86, confVar = "Social Studies")

d4 <- corVars(m1 = 14, m2 = 88, confVar = "Art")

d5 <- corVars(m1 = 12, m2 = 90, confVar = "Physical Education")

# Create the aggregate data

df<-rbind(d1,d2,d3,d4,d5)

# Grade & Study Time Plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# Grade & Study Time Correlation

cor(df$Var1, df$Var2)

# PhysEd Plot

df \%>\%

filter(Var3 == "Physical Education") \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 13), alpha = 0.55, shape = 21, fill = "darkgray", color = "black") +

scale\_y\_continuous(name = "Final Percentage", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

guides(size = FALSE) +

ggtitle("Impact of Studying on Final Grades (Physical Education Only)")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

# PhysEd Correlation

cor(df$Var1[df$Var3 == "Physical Education"], df$Var2[df$Var3 == "Physical Education"])

# Confounding plot

df \%>\%

ggplot(aes(x = Var1, y = Var2/100)) +

geom\_jitter(aes(size = 1, fill = Var3), alpha = 0.25, shape = 21) +

guides(fill = guide\_legend(title = "Course Class", override.aes = list(size = 5)),

size = FALSE) +

scale\_y\_continuous(name = "Testing Results", labels = percent)+

scale\_x\_continuous(name = "Approximate Hours for Preparation")+

ggtitle("Impact of Studying on Final Grades")+

theme(plot.title = element\_text(hjust = 0.5))+

theme\_bw()

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük