Cel mai bun răspuns
Constanta într-o ecuație de regresie este valoarea variabila dependentă variabilele explicative iau valori zero. aceasta înseamnă că va depinde de ceea ce explică ecuația de regresie. De exemplu, dacă ecuația de regresie este o funcție a costului total, constanta sau interceptarea reprezintă costul fix, adică se va suporta dacă unitatea nu produce și nu vinde nimic. Coeficientul de pantă reprezintă costul variabil care va fi adăugat la costul total pe măsură ce producția este realizată de o unitate. În cazul unei ecuații liniare a tendinței timpului în care tendința timpului este măsurată ca 0, 1, 2,3, … n ani, constanta este egală cu valoarea inițială a seriei temporale. în cazul unei variabile fictive explicative cu valorile 0 sau 1, coeficientul variabilei fictive reprezintă fie o deplasare ascendentă a constantei când se întâmplă starea prezentată de variabila fictivă (luând o valoare de 1).
Răspuns
Aplicarea unui jurnal pe variabila de ieșire a unui model de regresie (pentru a reduce supra-dispersia) este o abordare corectă?
Dacă utilizarea unei transformări de jurnal pentru o variabilă dependentă este adecvată depinde foarte mult de natura variabilei dependente.
Atunci când o variabilă este un număr de frecvențe al comportamentelor (cum ar fi numărul de comportamente delincvente în rândul studenților HS) cu o frecvență modală de 0 și o dispersie largă a scorurilor diferite de zero, este mult mai bine să folosiți un model de regresie care are sens pentru acest tip de date (cum ar fi Poisson sau binomul negativ sau beta , zero-umflat sau nu) decât pentru a jurnal transforma scorurile. De exemplu:
Când scorurile unei variabile nu diferă cu cel puțin 2 sau 3 ordine de mărime (de exemplu, cel mai mare scorul este doar de 10 ori cel mai mic scor, mai degrabă decât de 1000 de ori), trebuie să verificați dacă aplicarea unei transformări de jurnal este într-adevăr corectă pentru dispersie. În situațiile în care există o gamă limitată de valori pentru Y, corelația dintre Y și log (Y) poate fi de aproximativ .90. În această situație, transformarea jurnalului nu a schimbat foarte mult forma distribuției, dar acum aveți problema interpretării rezultatelor în termeni de jurnal Y.
Dacă scorurile variază în funcție de ordinele de mărime ( în ceea ce privește unele variabile din biologie și astronomie), transformările logice sau de putere (poate atât pentru X, cât și pentru Y) pot fi utile. Vedeți exemplul de mai jos: în această situație, transformarea jurnalului nu corectează doar pentru forma de distribuție non normală (înclinată pozitiv); de asemenea, liniarizează asocierea X / Y. Exemplu din Warner, R. (2012). Statistici aplicate: De la bivariate la tehnici multivariate. Thousand Oaks: Sage