Machine Learning 은 "명시적으로 프로그램을 작성하지 않고, 컴퓨터가 스스로 규칙을 학습하는 연구분야"를 의미합니다.
Machine Learning은 보통 3가지 유형으로 구분됩니다.
- Supervised Learning, Unsupervised Learning, Reinforcement Learning
그 중 Supervised Learning 에 대해서 알아보겠습니다.
1) Supervised Learning_지도학습
- 정답이 있는 데이터를 통해 데이터 분류 / 올바른 결과를 예측하는 것을 목표로 합니다.
- Supervised Learning에는 Regression / Classification 이 있습니다.
ⓛ Regression
영어 공부 시간과 시험점수 결과 데이터가 있습니다. 영어 공부 시간에 따라 시험점수가 결정된다라고 생각합니다.
그렇다면 9시간 영어 공부를 한 결과 시험 점수는 몇 점일까?
위 문항이 Regression 의 예시입니다.
즉, 변수들 간의 상관관계를 찾는 것, 연속적인(Continous) 데이터로부터 결과를 예측하는 것 이다.
예측 결과가 숫자 일 때 사용합니다.
data hour_score;
input hour score;
datalines;
1 11
3 43
6 56
8 60
run;
proc sgplot data = hour_score;
scatter Y = score X = hour / markerattrs=(size=30);
run;
② Classification
시청한 tv 프로그램에 따라 선호도를 조사하였습니다.
새로운 tv 프로그램 A의 선호도는 무엇일까?
tv 프로그램의 속성에는 감독, 배우, 코믹성 등 다양한 속성이 있을 수 있습니다.
속성들을 파악해 새로운 tv 프로그램의 선호도를 예측할 수 있습니다.
즉, 주어진 데이터를 범주(category)에 따라 분류합니다.
예측 결과가 숫자가 아닐 때 사용하는 방법입니다
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.