안녕하세요
앞서 SAS Analytics에 대해 설명드렸습니다. SAS Analytics를 기반으로 머신러닝을 구현할 수 있는 tool이 Viya와 VDMML입니다.
이번 게시글은 SAS Viya의 5가지의 특징에 대해 알아보고자 합니다.
SAS Viya은 편의성, 개방성, 알고리즘, 고성능, 용이성 이렇게 5가지의 특징을 가집니다.
첫번째 SAS Viya의 특징은 편의성 입니다.
편의성은 말그대로 다양한 interface를 제공한다는 의미입니다.
왼쪽 상단의 그림은 SAS VA입니다. VA는 분석에 대해 알지 못하는 사용자도 데이터를 Drag & Drop으로 여러가지 그래프들을 그려볼 수 있습니다. 그리고 그린 그래프를 통해서 insight를 도출 할 수 있습니다.
-> Visual환경에서 분석
또한, SAS Viya는 programming에 기반을 두고 있습니다. programming에 대한 이해가 있는 사용자라면 visual환경이 아닌 programming 환경에서 분석을 할 수 있습니다. 오른쪽 상단의 그림은 SAS Studio라는 interface 안에서 직접 코딩하거나 snippet(SAS 코드를 빠르고 삽입하고 필요에 맞게 사용자 정의할수 있는 작업으로 SAS Studio에서는 Snippet이 제공됩니다.)이라는 템플릿을 제공합니다.
->코드를 이용하여 분석
R이나 Python같은 오픈소스를 이용하는 사용자들에게 편의성을 제공하기 위해 SAS는 Jupyternotebook에서도 이용 가능합니다. (왼쪽 하단의 그림)
그리고 SAS Viya는 Visual Pipeline을 통해서 Process Flow를 만들어볼 수 있습니다.
이러한 4가지의 특징은 multi skills를 가지고 있는 모든 user들이 Viya 플랫폼 안에서 분석이 가능합니다
또한, 템플릿을 활용하여 모델 생산성 향상 측면서에 SAS Viya는 편의성을 가집니다.
SAS VDMML을 설치하기만 해도, 소유자가 SAS Pipeline이라고 되어있는 다양한 템플릿을 제공합니다. template는 target level에 따라 달라질 수 있습니다. 그리고 같은 target level이라 하더라도 분석 수준에 따라 템플릿을 달리할 수 있습니다. 템플릿에 대한 자세한 설명이 있기 때문에 원하는 파이프라인을 통해 분석을 진행하실 수 있습니다.
SAS는 사용자 templates이 제공됩니다. 기업내에 검증된 유용한 Process Flow를 있다면, 다른 사용자들도 이용이 가능하게 공유될 수 있습니다. 각 사용자가 분석을 다루는 것에 대한 격차가 달라도 템플릿을 이용한다면 분석의 상향평준화를 가져옵니다.
다음은 Visual Pipeline에 대한 그림입니다. Visual Pipeline은 앞에서 설명드린바와 같이 노드들을 직접 연결하여 분석 프로세스를 설계할 수도 있으며, 기존의 템플릿을 이용하셔도 됩니다. 노드들은 크게 ‘데이터 마이닝 사전 처리, 지도학습, 사후처리, 기타’ 4가지 카테고리로 되어있습니다.
+) 데이터 마이닝 사전처리란 feature engineering 기능들을 수행할 수 있는 노드들입니다.
+) 지도학습은 알고리즘에 관한 노드들입니다.
두번째 SAS Viya의 특징은 ‘개방성’입니다.
Visual Interface, Programming Interface(Python or R을 사용하는 user들도 여러가지 interface들로 사용가능) , API Interface까지 SAS Viya안에서 수행가능합니다. 그리고, 여러가지 Programming Interface들을 통해서 분석할 수 있는 환경을 제공하여 architecture 기반의 확장성을 제공하는 역할까지 합니다.
세번째, SAS Viya의 특징은 ‘머신러닝 알고리즘의 강화’입니다.
머신러닝, 딥러닝, 텍스트 분석,이미지 분석의 니즈가 있는 경우 각각 별도의 플랫폼을 도입해야 합니다. SAS는 Viya라는 단일 플랫폼 안에서 4가지의 분석(머신러닝, 딥러닝, 텍스트분석, 이미지분석)이 동시에 가능합니다.
머신러닝 알고리즘뿐 아니라 데이터 준비, 추가적인 분석부분에 대해서도 알고리즘을 제공하고 있습니다.
Decision Tree, Random Forest, Gradient Boosting,Neural Networks, Support Vector Machines, Factorization Machines 이렇게 6가지 알고리즘들에 대하서는 Auto Tuning 기능이 지원됩니다.
+ Auto Tunning이란 Hyperparameter optimization을 의미합니다.
다른 솔루션의 경우, Auto Tunning을 할 때 표준 그리드 탐색, 랜덤 탐색을 사용합니다.
SAS에서는 라틴 하이퍼큐브를 통해 효율적으로 단시간안에 최적의 값을 찾아낼 수 있습니다.
Machine Learning이나 DeepLearning을 통한 분석의 성능은 굉장히 좋지만 해석이 되지 않는다는 단점이 있습니다. blackbox이기 때문에 어떠한 변수가 y값에 영향을 미치는지 모르는 경우가 대부분 입니다.
VDMML에서는 정확한 모델을 만들어내는 것 뿐 아니라 변수와 y값 간의 관계를 설명가능한 ‘모델해석력’ 기능을 제공합니다. -> whitebox
모델 해석력 기능은 Partial Dependence Plots, Individual Conditional Expectation, Local Interpretable Model-agnostic Explanations 그래프 형태로 제공됩니다.
네번째 SAS Viya의 특징은 빅데이터를 빠르고 쉽게 처리할 수 있는 ’우수한 성능 시스템’을 가지고 있다는 것 입니다. 인메모리기반으로 되어있어 병렬데이터 로딩, 멀티 스레드 로딩이 용이합니다.
다섯번째 SAS Viya의 특징은 ‘용이성’입니다.
만들어진 모델이 쉽고 용이하게 배포하고 만들어진 모델을 운영하는 과정에서 모니터링을 자동으로 가능합니다. 이렇게 모니터링이 가능하게 되면, 모델 성능이 언제 저하되었는지 판단 할 수 있습니다.
또한, SAS VDMML은 VA안에서도 구현이 가능합니다. 6개의 알고리즘들에 대해서 사용자가 가지고 있는 데이터를 쉽게 분석할 수 있는 프로토타입 기능을 합니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.