Beste svaret
Konstanten i en regresjonsligning er verdien av den avhengige variabelen de forklarende variablene får nullverdier. Betydningen vil avhenge av hva regresjonsligningen forklarer. For eksempel hvis regresjonsligningen er en total kostnadsfunksjon, representerer konstanten eller avskjæringen den faste kostnaden, det vil si at det vil påløpe om virksomheten ikke produserer og selger noe. Hellingskoeffisienten representerer den variable kostnaden som vil legges til den totale kostnaden ettersom produksjonen er på grunn av en enhet. I tilfelle en lineær ligningstid hvor tidstrenden måles som 0, 1, 2,3, … n år, er konstanten lik startverdien til tidsserien. i tilfelle av en dummyvariabel som forklarer verdiene 0 eller 1, representerer koeffisienten til dummyvariabelen enten en oppadgående forskyvning i konstanten når tilstanden som presenteres av dummyvariabelen skjer (med en verdi på 1).
Svar
Er det å bruke en logg på utgangsvariabelen til en regresjonsmodell (for å redusere overdispersjon) en riktig tilnærming?
Hvorvidt bruk av en loggtransformasjon for en avhengig variabel er hensiktsmessig, avhenger veldig av arten til den avhengige variabelen.
Når en variabel er et frekvensantall av atferd (f.eks. antall kriminelle oppførsel blant HS-studenter) med en modalfrekvens på 0 og bred spredning av ikke-null-poeng, er det langt bedre å bruke en regresjonsmodell som gir mening for den slags data (for eksempel Poisson eller negativ binomial eller beta , null oppblåst eller ikke) enn å logge transformere poengsummen. For eksempel:
Når score på en variabel ikke avviker med minst 2 eller 3 størrelsesordener (f.eks. Høyeste poengsummen er bare 10 ganger laveste poengsum i stedet for 1000 ganger), må du sjekke om bruk av en loggtransformasjon virkelig gjør det riktig for spredning. I situasjoner der det er et begrenset verdiområde for Y, kan korrelasjonen mellom Y og log (Y) være rundt .90. I denne situasjonen har ikke loggtransformasjonen egentlig endret distribusjonsformen veldig mye, men du har nå problemet med å tolke resultatene i form av log Y.
Hvis poengene varierer etter størrelsesorden ( som for noen variabler i biologi og astronomi), kan logg- eller krafttransformasjoner (kanskje for både X og Y) være nyttige. Se eksemplet nedenfor: i denne situasjonen korrigerer loggtransform ikke bare for ikke normal (positivt skjev) distribusjonsform; det lineariserer også X / Y-foreningen. Eksempel fra Warner, R. (2012). Anvendt statistikk: Fra bivariate gjennom multivariate teknikker. Thousand Oaks: Sage