Najlepsza odpowiedź
Stała w równaniu regresji to wartość zmienna zależna zmienne objaśniające przyjmują wartości zerowe. jego znaczenie będzie zależeć od tego, co wyjaśnia równanie regresji. Na przykład, jeśli równanie regresji jest funkcją kosztu całkowitego, stała lub punkt przecięcia reprezentuje koszt stały, to znaczy zostanie poniesiony niezależnie od tego, czy zakład niczego nie produkuje ani nie sprzedaje. Współczynnik nachylenia reprezentuje koszt zmienny, który zostanie dodany do kosztu całkowitego w miarę wytwarzania produkcji przez jednostkę. W przypadku równania liniowego trendu czasowego, w którym trend jest mierzony jako 0, 1, 2,3,… n lat, stała jest równa wartości początkowej szeregu czasowego. w przypadku zmiennej fikcyjnej objaśniającej o wartościach 0 lub 1, współczynnik zmiennej fikcyjnej reprezentuje albo przesunięcie w górę stałej, gdy zachodzi warunek przedstawiony przez zmienną fikcyjną (przyjmując wartość 1).
Odpowiedź
Czy zastosowanie dziennika do zmiennej wyjściowej modelu regresji (w celu zmniejszenia nadmiernej dyspersji) jest poprawnym podejściem?
To, czy użycie transformacji logarytmicznej dla zmiennej zależnej jest właściwe, zależy w dużej mierze od natury zmiennej zależnej.
Kiedy zmienna jest liczbą częstości zachowań (takich jak liczba zachowań przestępczych wśród uczniów HS) z modalną częstotliwością 0 i szerokim rozproszeniem wyników niezerowych, znacznie lepiej jest użyć modelu regresji, który ma sens dla tego rodzaju danych (takich jak Poissona lub ujemny dwumian lub beta , napompowane do zera lub nie), niż logować transformację wyników. Na przykład:
Gdy wyniki zmiennej nie różnią się o co najmniej 2 lub 3 rzędy wielkości (np. Najwyższa wynik to tylko 10 razy najniższy wynik, a nie 1000 razy), należy sprawdzić, czy zastosowanie transformacji dziennika rzeczywiście poprawia dyspersję. W sytuacjach, w których istnieje ograniczony zakres wartości Y, korelacja między Y i log (Y) może wynosić około 0,90. W tej sytuacji transformacja logarytmiczna tak naprawdę nie zmieniła zbytnio kształtu rozkładu, ale teraz masz problem z interpretacją wyników w postaci log Y.
Jeśli wyniki różnią się o rząd wielkości ( jeśli chodzi o niektóre zmienne w biologii i astronomii), przydatne mogą być transformacje logarytmiczne lub potęgowe (być może zarówno dla X, jak i Y). Zobacz poniższy przykład: w tej sytuacji transformacja logarytmiczna nie tylko koryguje nienormalny (dodatnio pochylony) kształt rozkładu; linearyzuje również asocjację X / Y. Przykład z Warner, R. (2012). Statystyki stosowane: od technik dwuwymiarowych do technik wielowymiarowych. Tysiąc dębów: szałwia