Melhor resposta
A constante em uma equação de regressão é o valor de a variável dependente as variáveis explicativas assumem valores zero. seu significado dependerá do que a equação de regressão está explicando. Por exemplo, se a equação de regressão é uma função de custo total, a constante ou interceptação representa o custo fixo, ou seja, será incorrido se o estabelecimento não produz e vende nada. O coeficiente de inclinação representa o custo variável que será adicionado ao custo total à medida que a produção é calculada por unidade. No caso de uma equação linear de tendência temporal em que a tendência temporal é medida como 0, 1, 2,3, … n anos, a constante é igual ao valor inicial da série temporal. no caso de uma variável fictícia explicativa com valores 0 ou 1, o coeficiente da variável fictícia representa um deslocamento para cima na constante quando a condição apresentada pela variável fictícia acontece (assumindo o valor 1).
Resposta
Aplicar um registro na variável de saída de um modelo de regressão (para reduzir a superdispersão) é uma abordagem correta?
Se o uso de uma transformação de log para uma variável dependente é apropriado depende muito da natureza da variável dependente.
Quando uma variável é uma contagem de frequência de comportamentos (como o número de comportamentos delinquentes entre alunos HS) com uma frequência modal de 0 e ampla dispersão de pontuações diferentes de zero, é muito melhor usar um modelo de regressão que faça sentido para esse tipo de dados (como Poisson ou binomial negativo ou beta , inflado de zero ou não) do que transformar as pontuações em log. Por exemplo:
Quando as pontuações em uma variável não diferem em pelo menos 2 ou 3 ordens de magnitude (por exemplo, a mais alta pontuação é apenas 10 vezes a pontuação mais baixa em vez de 1000 vezes), você precisa verificar se a aplicação de uma transformação de log realmente corrige a dispersão. Em situações em que há uma faixa limitada de valores para Y, a correlação entre Y e log (Y) pode ser em torno de 0,90. Nessa situação, a transformação do log não mudou muito a forma da distribuição, mas agora você tem o problema de interpretar os resultados em termos de log Y.
Se as pontuações variam em ordens de magnitude ( quanto a algumas variáveis em biologia e astronomia), log ou transformações de poder (talvez para X e Y) podem ser úteis. Veja o exemplo abaixo: nesta situação, a transformação do log não corrige apenas a forma de distribuição não normal (distorcida positivamente); também lineariza a associação X / Y. Exemplo de Warner, R. (2012). Estatística Aplicada: De técnicas bivariadas a multivariadas. Thousand Oaks: Sage