BookmarkSubscribeRSS Feed

[AI] Automated MachineLearning

Started ‎07-30-2024 by
Modified ‎07-30-2024 by
Views 643

기존 Machine Learning의 Work Flow는 아래와 같이 5단계로 구성됩니다.

  1. 문제 정의(Define Problem)

  2. 데이터 수집(Collect Data)

  3. 전처리(Preprocess Data)

  4. Train Model

  5. Evaluate

위 5단계에서 3번째 ~ 5번째는 전문가들이 아닐 경우 어려울 수 있습니다.

그래서 Auto Machine Learning을 활용하게 된다면 위 5단계 중 3 ~ 5번째 단계는 사라지고, 다음과 같은 Work Flow를 구성하게 됩니다.

  1. 문제 정의

  2. 데이터 수집(Collect Data)

  3. AutoML

AutoML은 전처리, Train Model, Evaluate를 자동화한 것으로 효율성, 비전문가들도 참여할 수 있다라는 장점이 있습니다.

 

 

 

■ AutoML의 PipeLine

 

스크린샷_2024-07-30_오후_1.33.44.png

 

 

 

위 그림은 AutoML의 PipeLine입니다.

크게 보면 크게 Data Preparation > Feature Engineering > Model Evaluation 로 구성되어 있습니다.

기존 ML과 큰 차이점은 AutoML의 Feature Engineering을 자동화하는 PipeLine이 존재한다라는 것 입니다.

다양한 Auto Feature Engineering 중 Python 라이브러리의 Feature Tools이 가장 유명합니다.

Feature Tools라이브러리는 오픈소스 라이브러리로 Deep Feature Synthesis(DFS) 기술을 활용해 데이터로부터 자동으로 특성을 생성합니다. 복잡한 데이터 변환을 수행하지 않고 머신러닝 모델에 적합한 다양한 특성을 만들 수 있습니다.

■ AutoML의 메타러닝

 

메타러닝은 모델 학습의 효율성을 높이기 위해 과거 데이터를 바탕으로 학습하는 기술을 의미합니다.

Learning to Learn 이라는 개념으로 여러 학습 데이터를 가지고 새로운 테스크에서 성능을 향상시키는 것을 목표로 합니다.

 

 

Version history
Last update:
‎07-30-2024 01:38 AM
Updated by:
Contributors

sas-innovate-white.png

Missed SAS Innovate in Orlando?

Catch the best of SAS Innovate 2025 — anytime, anywhere. Stream powerful keynotes, real-world demos, and game-changing insights from the world’s leading data and AI minds.

 

Register now

Article Labels
Article Tags