Meilleure réponse
Ce nest malheureusement pas une terminologie standardisée. Mais lidée générale est que cest utilisées dans les «quasi-expériences»: celles dans lesquelles le chercheur ne peut pas réaliser une véritable randomisation dans des conditions. Comparez deux situations:
(1) Lorsque vous franchissez la porte pour une expérience, nous lançons une pièce (ou jetons un dé, etc.), et cela détermine à quelle condition vous êtes affecté. est une variable « indépendante », en ce sens quelle en elle-même ne devrait pas être corrélée aux résultats expérimentaux. [Les guillemets indiquent que le sens de « indépendant » est différent en régression.]
(2) Lorsque vous franchissez la porte pour une expérience, nous utilisons quelque chose sur vous (la couleur de vos yeux, le nombre de frères et sœurs que vous avez, votre sexe, votre diplôme de premier cycle, si vous « renaître une année impaire ou paire, etc.) pour déterminer à quelle condition vous » êtes affecté. Ce sont des « quasi-indépendants »: les niveaux ou catégories existent avant lexpérience et, surtout, peut être corrélé dune manière ou dune autre à des résultats expérimentaux par eux-mêmes .
Il devrait être évident que le sexe est une terrible variable « indépendante », car elle est liée à tellement beaucoup dautres tra ses résultats expérimentaux. La couleur des yeux semble meilleure, mais elle est en corrélation avec lappartenance ethnique. Que vous soyez né dans une année impaire ou paire semble presque comme lancer une pièce; mais, dans une population universitaire, cela peut rendre plus probable que vous soyez, disons, un étudiant de première année, et donc plus jeune. Un meilleur dispositif de quasi-randomisation est donc de savoir si vous êtes né à une date paire ou impaire.
Dans les études médicales, la randomisation réelle est presque impossible, car même la décision de participer à létude peut affecter les résultats. Plus précisément, les personnes qui choisissent un traitement plutôt quun autre ne le font pas au hasard, donc comparer leurs résultats peut être dénuée de sens; lexemple classique est que les gens sont plus susceptibles de mourir dans les grands hôpitaux urbains que dans les cliniques locales, car les premiers Prenons les cas les plus graves.
Dans les études en sciences sociales, les problèmes peuvent être plus graves, car il y a tellement deffets associés au «traitement». Par exemple, si nous voulons déterminer si seuls les enfants sont plus confiants que ceux qui ont des frères et sœurs, nous pourrions être tentés de simplement comparer ces groupes. Mais les familles avec seulement des enfants peuvent différer systématiquement de celles qui en ont plus – peut-être que les parents se sont mariés plus tard, n’ont pas les ressources nécessaires pour élever plus d’enfants, vivent dans une ville environnement – donc faire des déclarations causales peut être extrêmement difficile en utilisant la variable quasi-indépendante « seul enfant ».
Réponse
Une variable de contrôle est une variable indépendante, juste une qui nest pas lobjet de létude. La différence est dans lesprit de lenquêteur, pas dans les statistiques.
Par exemple, supposons que vous vouliez étudier leffet dun médicament sur une condition. Cependant, vous savez que la condition est également affectée par lâge du patient. Létude de leffet de lâge ne vous intéresse pas, mais si vous lignorez, vous aurez beaucoup de bruit dans vos résultats.
Une stratégie simple avec une variable de contrôle est de la maintenir constante dans votre étude – en supposant que vous ayez cette capacité. Vous pourriez tester votre médicament uniquement sur des personnes de 40 ans par exemple. Cela élimine les différences deffets causées par lâge, sans aucune modélisation.
Une stratégie connexe consiste à séparer vos données par âge du patient et à les analyser séparément pour chaque âge. Cela pourrait être raisonnable si leffet était totalement différent en fonction de lâge, mais serait inefficace dans la plupart des cas. Bien que lâge affecte les résultats, vous pouvez probablement utiliser les informations sur leffet sur les 40 ans pour avoir une idée de leffet sur les 50 ans.
Cela conduit à la troisième stratégie majeure, inclure lâge comme variable indépendante et modéliser son effet avec leffet du médicament. Cest la même chose que vous feriez dans une étude si lintérêt principal était leffet de lâge du patient; ou sil y avait un intérêt à la fois pour leffet du médicament et pour leffet de lâge du patient. La seule différence est que, puisque vous ne vous intéressez quau médicament, vous ignorez les paramètres du modèle pour lâge.
Enfin, la quatrième approche courante consiste à extraire leffet de lâge avant de regarder les résultats du médicament. . Ceci est souvent choisi sil existe déjà un bon modèle pour leffet de lâge. Dans ce cas, vous nétudiez pas leffet du médicament sur le résultat brut du patient, mais sur le résultat du patient ajusté en fonction de lâge.