Bästa svaret
Konstanten i en regressionsekvation är värdet på den beroende variabeln får de förklarande variablerna nollvärden. det betyder beror på vad regressionsekvationen förklarar. Till exempel om regressionsekvationen är en totalkostnadsfunktion, representerar konstanten eller avlyssningen den fasta kostnaden, det vill säga kommer det att uppstå om anläggningen inte producerar och säljer någonting. Lutningskoefficienten representerar den variabla kostnaden som kommer att läggas till den totala kostnaden eftersom produktionen sker genom en enhet. I fallet med en linjär ekvation för tidstrend där tidstrenden mäts som 0, 1, 2,3, … n år, är konstanten lika med tidsseriens startvärde. i fallet med en dummyvariabel som förklaras med värdena 0 eller 1, representerar dummyvariabelns koefficient antingen uppåtförskjutning i konstanten när tillståndet som presenteras av dummyvariabeln inträffar (tar värdet 1).
Svar
Är det korrekt att använda en logg på utgångsvariabeln för en regressionsmodell (för att minska överdispersion)? >
Huruvida användningen av en loggtransformation för en beroende variabel är lämplig beror väldigt mycket på den beroende variabelns natur.
När en variabel är ett frekvensantal för beteenden (t.ex. antalet brottsliga beteenden bland HS-studenter) med en modalfrekvens på 0 och bred spridning av icke-nollpoäng, är det mycket bättre att använda en regressionsmodell som är meningsfull för den typen av data (som Poisson eller negativ binomial eller beta , uppblåst noll eller inte) än att logga omvandla poängen. Till exempel:
När poäng på en variabel inte skiljer sig åtminstone med två eller tre storleksordningar (t.ex. högsta poäng är bara 10 gånger lägsta poäng snarare än 1000 gånger), måste du kontrollera om du använder en loggtransformation verkligen fungerar för dispersion. I situationer där det finns ett begränsat intervall av värden för Y kan korrelationen mellan Y och log (Y) vara runt .90. I den här situationen har inte loggtransformationen verkligen förändrat distributionens form, men du har nu problemet med att tolka resultat i termer av log Y.
Om poängen varierar efter storleksordningar ( som för vissa variabler inom biologi och astronomi) kan logg- eller krafttransformationer (kanske för både X och Y) vara användbara. Se exemplet nedan: i den här situationen korrigerar logtransformation inte bara för icke normal (positivt sned) fördelningsform; det linjäriserar också X / Y-föreningen. Exempel från Warner, R. (2012). Tillämpad statistik: Från bivariat till multivariat. Thousand Oaks: Sage