La mejor respuesta
Desafortunadamente, no se trata de una terminología estandarizada. Pero la idea general es que utilizado en «cuasi-experimentos»: aquellos en los que el investigador no puede realizar una verdadera aleatorización en condiciones. Compara dos situaciones:
(1) Cuando entras por la puerta para un experimento, tiramos una moneda (o tiramos un dado, etc.), y eso determina a qué condición estás asignado. Esto es una variable «independiente», en el sentido de que en sí misma no debe estar correlacionada con los resultados experimentales. [Las comillas indican que el sentido de «independiente» es diferente desde en regresión.]
(2) Cuando entras por la puerta para un experimento, usamos algo sobre ti (tu color de ojos, cuántos hermanos tienes, tu género, tu carrera universitaria, si «nace en un año par o impar, etc.) para determinar a qué condición está asignado. Estos son» cuasi-independientes «: los niveles o categorías existen antes del experimento y, lo que es más importante, pueden correlacionarse de alguna manera con los resultados experimentales por sí mismos .
Debería ser obvio que el género es una terrible variable «independiente», ya que está vinculado a muchos otros tra sus resultados experimentales y. El color de los ojos parece mejor, pero se correlaciona con el origen étnico. Si usted nació en un año par o impar, parece casi como lanzar una moneda; pero, en una población universitaria, puede hacer que sea más probable que seas, digamos, un estudiante de primer año y, por lo tanto, más joven. Por lo tanto, un mejor dispositivo cuasialeatorio es si naciste en una fecha par o impar.
En los estudios médicos, la aleatorización real es casi imposible, ya que incluso decidir participar en el estudio puede afectar los resultados. Más concretamente, las personas que eligen un tratamiento sobre otro no lo hacen al azar, por lo que comparar sus resultados puede no tener sentido; el ejemplo clásico es que las personas tienen más probabilidades de morir en hospitales grandes y urbanos que en clínicas locales, porque lo primero tomar los casos más graves.
En los estudios de ciencias sociales, los problemas pueden ser mayores, ya que hay tantos efectos asociados con el «tratamiento». Por ejemplo, si deseamos determinar si los hijos únicos son más más seguros de sí mismos que aquellos con hermanos, podríamos sentirnos tentados a comparar simplemente esos grupos. Pero las familias con hijos únicos pueden diferir sistemáticamente de las que tienen más; tal vez los padres se casaron más tarde, no tenían los recursos para criar más hijos, estaban en una zona urbana entorno – por lo que hacer declaraciones causales puede ser extremadamente difícil usando la variable cuasi-independiente «hijo único».
Respuesta
Una variable de control es una variable independiente, solo una que no es el enfoque del estudio. La diferencia es en la mente del investigador, no en las estadísticas.
Por ejemplo, suponga que desea estudiar el efecto de algún fármaco en alguna enfermedad. Sin embargo, sabe que la condición también se ve afectada por la edad del paciente. No le interesa estudiar el efecto de la edad, pero si lo ignora, tendrá mucho ruido en sus resultados.
Una estrategia simple con una variable de control es mantenerla constante en su estudio, suponiendo que tenga esa capacidad. Puede probar su medicamento solo en personas de 40 años, por ejemplo. Eso elimina las diferencias de efecto causadas por la edad, sin ningún modelo.
Una estrategia relacionada es segregar los datos por edad del paciente y analizarlos por separado para cada edad. Eso podría ser razonable si el efecto fuera totalmente diferente según la edad, pero sería ineficiente en la mayoría de los casos. Aunque la edad afecta los resultados, probablemente pueda usar información sobre el efecto en las personas de 40 años para tener una idea del efecto en las personas de 50 años.
Eso lleva a la tercera estrategia principal, incluir la edad como variable independiente y modelar su efecto junto con el efecto del fármaco. Esto es lo mismo que haría en un estudio si el interés principal fuera el efecto de la edad del paciente; o si había interés tanto en el efecto del fármaco como en el efecto de la edad del paciente. La única diferencia es que, dado que solo está interesado en el medicamento, ignora los parámetros del modelo para la edad.
Por último, el cuarto enfoque común es extraer el efecto de la edad antes de ver los resultados del medicamento. . Esto se elige a menudo si ya existe un buen modelo para el efecto de la edad. En ese caso, no se estudia el efecto del fármaco en el resultado bruto del paciente, sino en el resultado del paciente ajustado por edad.