최상 답변
회귀 방정식의 상수는 다음 값입니다. 설명 변수가 0 값을 갖는 종속 변수. 의미는 회귀 방정식이 설명하는 것에 달려 있습니다. 예를 들어 회귀 방정식이 총 비용 함수 인 경우 상수 또는 절편은 고정 비용을 나타냅니다. 즉, 시설이 아무것도 생산 및 판매하지 않는 경우 발생합니다. 기울기 계수는 생산이 단위로 이루어짐에 따라 총 비용에 추가되는 가변 비용을 나타냅니다. 시간 추세가 0, 1, 2,3,… n 년으로 측정되는 시간 추세 선형 방정식의 경우 상수는 시계열의 시작 값과 같습니다. 값이 0 또는 1 인 더미 변수 설명의 경우, 더미 변수의 계수는 더미 변수가 제시하는 조건이 발생할 때 상수의 상향 이동을 나타냅니다 (값 1을 취함).
답변
과대 산포를 줄이기 위해 회귀 모델의 출력 변수에 로그를 적용하는 것이 올바른 접근 방식입니까?
종속 변수에 대한 로그 변환 사용이 적절한 지 여부는 종속 변수의 특성에 따라 크게 달라집니다.
변수가 행동의 빈도 수인 경우 (예 : 모달 빈도가 0이고 0이 아닌 점수가 광범위하게 분산되어있는 고등학생 간의 연체 행동 수) 이러한 종류의 데이터 (예 : 포아송 또는 음 이항 또는 베타)에 적합한 회귀 모델을 사용하는 것이 훨씬 좋습니다. , zero-inflated 또는 not) 점수를 로그 변환하는 것보다. 예 :
변수 점수가 최소 2 ~ 3 배 차이가 나지 않는 경우 (예 : 점수가 1000 배가 아니라 10 배에 불과한 경우) 로그 변환을 적용하면 실제로 분산이 올바른지 확인해야합니다. Y 값의 범위가 제한된 상황에서 Y와 log (Y) 간의 상관 관계는 약 .90 일 수 있습니다. 이 상황에서 로그 변환은 실제로 분포의 모양을 크게 변경하지 않았지만 이제 로그 Y 측면에서 결과를 해석하는 데 문제가 있습니다.
점수가 규모에 따라 달라지는 경우 ( 생물학과 천문학의 일부 변수의 경우) 로그 또는 전력 변환 (아마도 X와 Y 모두)이 유용 할 수 있습니다. 아래 예를 참조하십시오.이 상황에서 로그 변환은 비정규 (양으로 치우친) 분포 모양을 수정할뿐만 아니라; 또한 X / Y 연관성을 선형화합니다. Warner, R. (2012)의 예. 응용 통계 : 이변 량에서 다변량 기술까지. 사우 전드 오크스 : 세이지