데이터 분석

회귀분석(Regression Analysis) - IV

torukmakto 2023. 6. 9. 23:07

앞에서 수행했던 '매출액' ~ '광고비' 회귀분석에 대한 정보를 확인해 보도록 하겠습니다.

 

R 회귀분석

 

상기와 같이 R에서 실행 후, 해당 회귀식 수행 후에 나오는 정보를 보여주는 'summary'

명령어를 이용하여 아래와 같은 내용을 볼 수 있습니다.

 

summary: 회귀식 수행 후 나오는 정보를 보여주는  R 명령어

 

R 'summary'

 

상기 이미지에서 보여지는 항목들의 의미는 다음과 같다고 합니다.

 

1. Coefficients 部

     - (Intercept) >> 절편 (일반적 형태의 선형회귀식에서 'a'에 해당)
     - 광고비      >> 기울기 (일반적 형태의 선형회귀식에서 'b'에 해당)

     - Estimate   >> 계수 추정한 값 (a, b 값)

     - Std. Error  >>  각 계수에 해당되는 error

     - t value       >> 테스트 할 때 쓸 수 있는 검정 통계량 (t-test)

                              (Estimate을 Std. Error로 나눈 값)

     - Pr(>|t|)      >>  p-value  

                              (p-value가 유의수준 5%(0.05) 보다 작으면 통계적으로

                              해당 모델은 유의미 하다고 해석할 수 있음)

 

2. Residual standard error 部

    - Residual standard error >> 표준오차 추정치      

 

3. Multiple R-squared 部

    - Multiple R-squared  >> 결정계수

 

4. F-statistics 部

    - F-statistics  >> 모형(모델)을 검증할 때, 이 모형이 통계적으로 유의미 한지 

                               아닌지 판단 할 때 사용. (F-test)

 

X가 하나인 단순회귀의 경우 F-test(F-statistics)가 t-test와 똑같다고 합니다.

왜냐하면, 모형이 필요 있냐 없냐는 X가 하나이기 때문에 X가 필요하냐 않하냐와

똑같은 말이고, 그 말은 b가 '0' 이냐 아니냐 테스트하는 것과 똑같은 말이기 때문에

p-value가 똑같게 나오는 것이라고 합니다.

 

위 이미지에서도 '광고비' 에 대한 'Pr(>|t|) '와 F-statistics에서의 'p-value'가

0.027.로 동일합니다.