안녕하세요 MYSAS 시샵 입니다.
오늘 시간에는 SAS VDMML 을 사용하는 방법에 대하여 알아 보기로 하겠습니다.
SAS VDMML은 Visual Data Mining Machine Learning 의 줄임말로 SAS의 VIYA 기반에서 운영 됩니다.
통합적인 시각화(프로그래밍) 인터페이스를 통하여 분석 라이프 사이클의 모든 작업을 처리하는 엔드 투 엔드(End-to-end)로 데이터 마이닝 및 머신러닝 프로세스를 지원하는 제품입니다.
Python, R, Java 및 Lua 프로그래머는 SAS 프로그래밍 방법을 배우지 않고도 다른 프로그래밍 언어를 통해 검증된 SAS 머신러닝 알고리즘에 액세스하여 분석이 가능 합니다. 또한 자동 생성된 SAS 스코어 코드를 사용하여 예측 모델을 신속하게 배포할 수 있는 강점이 있어요 ^^
VDMML에서 [모델 생성]을 클릭하면 새로운 프로젝트를 만들 수 있습니다.
새로운 프로젝트의 이름을 입력하고, 프로젝트의 유형을 선택합니다. 프로젝트 유형에는 데이터 마이닝 및 머신 러닝, 예측, 텍스트 분석이 있습니다.
2. 데이터 불러오기
이름과 유형을 선택했으면 데이터를 불러와야 합니다. 인 메모리 환경에서 분석을 진행하기 때문에 로컬에 데이터가 있다면, 클라우드 환경으로 데이터를 불러와야 합니다. 로컬 데이터를 불러오는 과정입니다.
데이터 찾아보기 > 가져오기 > 로컬파일 을 선택해주면 클릭을 통해서 데이터를 가져올 수 있습니다.
데이터를 불러온 후, 데이터에 대한 정보를 확인할 수 있습니다. 바꾸고 싶은 설정이 있으면 이 단계에서 설정할 수 있습니다.
주의해야할 점은 한 개의 변수는 무조건 ‘Target’으로 설정해주어야 합니다.
3. 프로젝트 설정 편집
오른쪽 위에 설정 버튼을 클릭하면 프로젝트에 대한 전체적인 설정을 할 수 있습니다. 파이프라인을 실행한 후에는 편집이 불가능하기 때문에 정확하게 설정한 후 넘어가야합니다.
데이터 분할에서는 모델을 학습시키기 위한 트레인 데이터와 평가(Validation)와 검증(Test)를 위한 데이터를 나눌 수 있습니다.
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!