BookmarkSubscribeRSS Feed

[SAS 활용 노하우] 일원분산분석 part2

Started ‎11-27-2022 by
Modified ‎11-27-2022 by
Views 356

 

 

■ SAS: 분산분석 

 

image (3).png

 

 

사용된 데이터는 MGGarlic 데이터로 비료의 종류에 따라 마늘의 성장에 영향을 주는 지 알아볼 수 있는 데이터 셋입니다.

MGGarilc 데이터 셋에는 아래의 4개의 변수로 구성되어 있습니다.

Fertilizer 변수: 사용된 비료의 종류이며 categorical 변수로 1,2,3,4의 값을 가지고 있습니다.

BulbWt 변수는 구역별 마늘의 평균 무게이메 파운드로 무게를 측정하고 있습니다. 

Cloves 변수는 구역별 마늘의 평균 쪽 개수입니다.

BedID는 랜덤으로 할당된 구역 식별 번호 입니다.

데이터의 개수는 32개로 땅을 32개로 나누어 각 구역마다 비료들을 랜덤하게 할당하여 시간이 지난 후에 마늘의 무게(BulbWt)와 마늘 쪽의 개수(Cloves)를 측정하려고 합니다.

즉, One-Way ANOVA를 이용하여 비료(Fertilizer)별 마늘의 무게(BulbWt)에 대한 평균이 통계적으로 유의미한 차이를 보이는지 알아보려고 합니다.

 

 

 

image (4).png

 

 

[일원분산분석] 에서 [종속변수]에는 BulWt 변수를 선택하고 , [독립변수]에는 Fertilizer 변수를 선택합니다.

 

 

image (5).png

 

분산분석표에는 모델과 오차에 대한 제곱합, F 통계량, 유의확률 등을 확인할 수 있습니다.

여기서 유의확률을 보면 0.1432로 0.05보다 크기 때문에 귀무가설을 기각할 수 없습니다. 

따라서, 집단별 평균들은 통계적으로 유의한 차이가 없다라고 할 수 있습니다.

분산분석표에서 R-Square는 결정계수로 분산분석에서 독립변수들에 의해 설명되는 변동의 비율을 측정하는 통계량입니다.

R-Square는 0에서 1사이의 값을 가지고 독립변수들이 모형의 변동성을 많이 설명할수록 1에 가까운 값이 되고 변동성을 설명하지 못할수록 0에 가까운 값을 가집니다. 

R-Square 의 식은 아래와 같습니다.

 

image.png

 

위의 분산분석표에서 R-Square값은 해석은 Fertilizer가 BulbWt에 대한 변동성을 17.34% 정도 설명한다라고 할 수 있습니다.

Version history
Last update:
‎11-27-2022 04:27 AM
Updated by:
Contributors

hackathon24-white-horiz.png

The 2025 SAS Hackathon Kicks Off on June 11!

Watch the live Hackathon Kickoff to get all the essential information about the SAS Hackathon—including how to join, how to participate, and expert tips for success.

YouTube LinkedIn

Article Tags