Meilleure réponse
La constante dans une équation de régression est la valeur de la variable dépendante les variables explicatives prennent des valeurs nulles. sa signification dépendra de ce que léquation de régression explique. Par exemple, si léquation de régression est une fonction de coût total, la constante ou lintersection représente le coût fixe, cest-à-dire quelle sera encourue si létablissement ne produit et ne vend rien. Le coefficient de pente représente le coût variable qui sera ajouté au coût total à mesure que la production est inure par unité. Dans le cas dune équation linéaire de tendance temporelle où la tendance temporelle est mesurée comme 0, 1, 2,3,… n ans, la constante est égale à la valeur de début de la série chronologique. dans le cas dune variable fictive explicative de valeurs 0 ou 1, le coefficient de la variable fictive représente soit le déplacement vers le haut de la constante lorsque la condition présentée par la variable fictive se produit (prenant la valeur 1).
Réponse
Lapplication dun journal sur la variable de sortie dun modèle de régression (pour réduire la surdispersion) est-elle une approche correcte?
Si lutilisation dune transformation logarithmique pour une variable dépendante est appropriée dépend beaucoup de la nature de la variable dépendante.
Quand une variable est un décompte de fréquence de comportements (comme le nombre de comportements délinquants parmi les élèves HS) avec une fréquence modale de 0 et une large dispersion des scores non nuls, il est de loin préférable dutiliser un modèle de régression qui a du sens pour ce type de données (comme Poisson ou binomial négatif ou bêta , zéro-gonflé ou non) que de journaliser transformer les scores. Par exemple:
Lorsque les scores dune variable ne diffèrent pas dau moins 2 ou 3 ordres de grandeur (par exemple, le plus le score est seulement 10 fois le score le plus bas plutôt que 1000 fois), vous devez vérifier si lapplication dune transformation logarithmique corrige vraiment la dispersion. Dans les situations où il existe une plage limitée de valeurs pour Y, la corrélation entre Y et log (Y) peut être denviron 0,90. Dans cette situation, la transformation log na pas vraiment beaucoup changé la forme de la distribution, mais vous avez maintenant le problème dinterpréter les résultats en termes de log Y.
Si les scores varient par ordre de grandeur ( comme pour certaines variables en biologie et en astronomie), des transformations log ou de puissance (peut-être pour X et Y) peuvent être utiles. Voir lexemple ci-dessous: dans cette situation, la transformation log non seulement corrige la forme de distribution non normale (positivement asymétrique); il linéarise également lassociation X / Y. Exemple tiré de Warner, R. (2012). Statistiques appliquées: des techniques bivariées aux techniques multivariées. Thousand Oaks: Sage