정규분포란 좌우 대칭을 이루는 확률분포로 가우스 분포라고도 하며 평균값을 중심으로 대칭을 이루는 종 모양의 분포입니다.
검정을 시행할 때 정규분포가 전제가 되어야 검정을 시행할 수 있습니다.
정규분포의 식은 위와 같습니다.
m는 확률변수 X의 평균, σ 는 X의 표준편차이버 e는 네이피어 수(2.718 ...) 입니다.
SAS에서 air.socredata의 GPA 변수의 정규성을 검정해보겠습니다.
proc univariate data=air.scoredata;
var gpa;
histogram gpa / normal(mu=est sigma=est);
run;
scoredata에는 148개의 학생의 데이터가 있습니다. (정규성을 검정하기에는 작은 데이터입니다)
해당 값의 정규성 검정을 위해서 P 값을 살펴봐야 합니다.
P-Value 는 < 0.05 이므로 정규성을 따르지 않습니다.
■ 이항분포에서의 정규분포
이항분포에서 횟수를 늘리면 분포가 정규분포에 가까워집니다.
예를 들면, 동전 던지기를 10회, 20회, 1000회 등을 반복하다보면 시행횟수에 따라서 분포의 형태가 점점 정규분포의 형태로 변하게 됩니다.
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.