Mejor respuesta
La constante en una ecuación de regresión es el valor de la variable dependiente las variables explicativas toman valores cero. su significado dependerá de lo que explique la ecuación de regresión. Por ejemplo, si la ecuación de regresión es una función de costo total, la constante o el intercepto representa el costo fijo, es decir, se incurrirá en si el establecimiento no produce ni vende nada. El coeficiente de pendiente representa el costo variable que se agregará al costo total a medida que la producción se incremente por unidad. En el caso de una ecuación lineal de tendencia temporal en la que la tendencia temporal se mide como 0, 1, 2,3,… n años, la constante es igual al valor inicial de la serie temporal. en el caso de una variable ficticia explicativa con valores 0 o 1, el coeficiente de la variable ficticia representa un desplazamiento hacia arriba en la constante cuando ocurre la condición presentada por la variable ficticia (tomando un valor de 1).
Respuesta
¿Aplicar un registro en la variable de salida de un modelo de regresión (para reducir la sobredispersión) es un enfoque correcto?
Si el uso de una transformación logarítmica para una variable dependiente es apropiado depende mucho de la naturaleza de la variable dependiente.
Cuando una variable es un recuento de frecuencia de comportamientos (como el número de comportamientos delictivos entre los estudiantes de HS) con una frecuencia modal de 0, y una amplia dispersión de puntajes distintos de cero, es mucho mejor utilizar un modelo de regresión que tenga sentido para ese tipo de datos (como Poisson o binomio negativo o beta , inflado a cero o no) que registrar transformar las puntuaciones. Por ejemplo:
Cuando las puntuaciones de una variable no difieren en al menos 2 o 3 órdenes de magnitud (p. Ej., La más alta el puntaje es solo 10 veces el puntaje más bajo en lugar de 1000 veces), debe verificar si la aplicación de una transformación de registro realmente corrige la dispersión. En situaciones en las que existe un rango limitado de valores para Y, la correlación entre Y y log (Y) puede estar alrededor de .90. En esta situación, la transformación logarítmica no ha cambiado mucho la forma de la distribución, pero ahora tiene el problema de interpretar los resultados en términos de log Y.
Si las puntuaciones varían en órdenes de magnitud ( en cuanto a algunas variables en biología y astronomía), las transformaciones logarítmicas o de potencia (quizás tanto para X como para Y) pueden ser útiles. Vea el ejemplo siguiente: en esta situación, la transformación logarítmica no solo corrige la forma de distribución no normal (sesgada positivamente); también linealiza la asociación X / Y. Ejemplo de Warner, R. (2012). Estadística Aplicada: Desde técnicas bivariadas hasta multivariadas. Thousand Oaks: Sage