1-1. Statistics의 소개: 기초적인 통계적 개념(1)
안녕하세요^^
지난 시간까지 SAS를 활용하여 데이터를 전처리 하는 방법들에 대한 기초를 공부해 보았습니다.
이번 시간부터는 SAS를 활용하여, 데이터를 분석(ANOVA, 회귀, 로지스틱 회귀 등)하는 방법들에 대해 공부해보도록 하겠습니다.
데이터를 분석하기 전에,
데이터 분석에는 다양한 통계적 방법이 있기 때문에, 적절한 방법을 선택하기 위해서는 변수의 종류(연속형, 범주형)와 측정 수준(순서형, 명목형)을 확실하게 정의해야 합니다.
1) 연속형 / 범주형 변수
단, 특정 범위로 범주화 하는 과정을 통해, 연속형 변수를 범주형 변수로 변경할 수 있습니다.
2) 명목형 / 순서형 변수
3) 변수의 형태에 따른 분석 방법들
이번 강의에서는, 통계적 모델링에 대해 공부하게 됩니다.
모델링의 종류는 두 변수의 type과 측정 레벨에 따라 달라집니다.
위의 표처럼, Response Variables와 Predictor Variables가 범주형 변수인지, 연속형 변수인지에 따라 통계적 모델링에는 차이가 생기게 됩니다.
따라서, 각각의 변수의 성격에 따라 적절한 통계적 모델링을 세워야 합니다.
[ 모집단(POPULATIONS)과 표본(SAMPLES) ]
Simple random sampling이란, 각 모집단에서 동일한 확률로 표본이 선택되는 것을 의미합니다. Random sampling은 sample이 모집단을 대표하도록 합니다.
이제, sample을 이용하여 population을 추론하는 값에 대해 알아보도록 하겠습니다.
읽어주셔서 감사합니다.
다음 시간에는 기초적인 통계적 개념 두번째 시간으로 분포를 구성하는 통계량 값들에 대해 공부해보도록 하겠습니다.
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!