Beste antwoord
Het is helaas geen gestandaardiseerde terminologie. Maar het algemene idee is dat het gebruikt in “quasi-experimenten”: die waarin de onderzoeker geen echte randomisatie in voorwaarden kan uitvoeren. Vergelijk twee situaties:
(1) Als je de deur binnenloopt voor een experiment, gooien we een munt om (of gooien we een dobbelsteen, enz.), En dat bepaalt aan welke conditie je bent toegewezen. Dit is een “onafhankelijke” variabele, in die zin dat deze op zichzelf niet gecorreleerd moet zijn met experimentele resultaten. [De aanhalingstekens geven aan dat de betekenis van “onafhankelijk” anders is from in regressie.]
(2) Als je binnenkomt voor een experiment, gebruiken we iets over jou (je oogkleur, hoeveel broers en zussen je hebt, je geslacht, je undergrad major, of je nu opnieuw geboren in een oneven of even jaar, enz.) om te bepalen aan welke voorwaarde je bent toegewezen. Deze zijn quasi-onafhankelijk: de niveaus of categorieën bestaan vóór het experiment en, belangrijker nog, kan op de een of andere manier op zichzelf in verband worden gebracht met experimentele resultaten. .
Het zou duidelijk moeten zijn dat geslacht een vreselijke onafhankelijke variabele is, aangezien het hieraan vele andere tra zijn en experimentele resultaten. Oogkleur lijkt beter, maar het hangt samen met etniciteit. Of je nu in een oneven of even jaar geboren bent, lijkt bijna alsof je een munt opgooit; maar in een universiteitspopulatie kan het waarschijnlijker zijn dat je bijvoorbeeld een eerstejaars bent en dus jonger. Een beter quasi-willekeurig apparaat is daarom of je op een oneven of even datum bent geboren.
In medische onderzoeken is daadwerkelijke randomisatie bijna onmogelijk, aangezien zelfs de beslissing om deel te nemen aan het onderzoek de resultaten kan beïnvloeden. Sterker nog, mensen die de ene behandeling boven de andere verkiezen, doen dat niet willekeurig, dus het vergelijken van hun uitkomsten kan zinloos zijn; het klassieke voorbeeld is dat mensen eerder overlijden in grote stedelijke ziekenhuizen dan in lokale klinieken, omdat de eerste nemen de ernstigste gevallen.
In sociaalwetenschappelijke studies kunnen de problemen groter zijn, aangezien er zoveel effecten zijn verbonden aan de behandeling. Als we bijvoorbeeld willen bepalen of alleen kinderen meer zijn zelfverzekerd dan mensen met broers en zussen, zouden we in de verleiding kunnen komen om die groepen gewoon te vergelijken. Maar gezinnen met alleen kinderen kunnen systematisch verschillen van gezinnen met meer – misschien waren de ouders later getrouwd, hadden ze niet de middelen om meer kinderen groot te brengen, waren ze in een stad omgeving – dus het maken van causale uitspraken kan buitengewoon moeilijk zijn met behulp van de quasi-onafhankelijke variabele “enige kind”.
Antwoord
Een controlevariabele is een onafhankelijke variabele, maar een die dat niet is de focus van de studie. Het verschil is in de geest van de onderzoeker, niet in statistieken.
Stel dat u bijvoorbeeld het effect van een medicijn op een bepaalde aandoening wilt bestuderen. U weet echter dat de aandoening ook wordt beïnvloed door de leeftijd van de patiënt. Je bent niet geïnteresseerd in het bestuderen van het effect van leeftijd, maar als je het negeert, krijg je veel ruis in je resultaten.
Een eenvoudige strategie met een controlevariabele is om het constant te houden in je studie – ervan uitgaande dat je dat vermogen hebt. U kunt uw medicijn bijvoorbeeld alleen testen op 40-jarigen. Dat elimineert effectverschillen veroorzaakt door leeftijd, zonder enige modellering.
Een gerelateerde strategie is om uw gegevens te scheiden naar leeftijd van de patiënt en deze voor elke leeftijd afzonderlijk te analyseren. Dat zou redelijk kunnen zijn als het effect totaal verschillend zou zijn op basis van leeftijd, maar zou in de meeste gevallen inefficiënt zijn. Hoewel leeftijd de resultaten beïnvloedt, kunt u waarschijnlijk informatie over het effect op 40-jarigen gebruiken om een idee te krijgen van het effect op 50-jarigen.
Dat leidt tot de derde belangrijke strategie, om leeftijd op te nemen als een onafhankelijke variabele en modelleer het effect ervan samen met het medicijneffect. Dit is hetzelfde als u zou doen in een onderzoek als de primaire interesse lag op het effect van de leeftijd van de patiënt; of als er interesse was in zowel het effect van het medicijn als het effect van de leeftijd van de patiënt. Het enige verschil is dat, aangezien u alleen in het medicijn geïnteresseerd bent, u de modelparameters voor leeftijd negeert.
Ten slotte is de vierde veel voorkomende benadering om het effect van leeftijd te extraheren voordat u naar de medicijnresultaten kijkt . Hiervoor wordt vaak gekozen als er al een goed model voor het ouderdomseffect bestaat. In dat geval bestudeer je niet het effect van het medicijn op het ruwe resultaat voor de patiënt, maar op het voor leeftijd gecorrigeerde resultaat voor de patiënt.