- Mark as New
- Bookmark
- Subscribe
- Mute
- RSS Feed
- Permalink
- Report Inappropriate Content
안녕하세요?
SAS 코리아입니다.
아래 기고문은 서울대학교 행정대학원 고길곤 교수의 기고문으로 SAS OnDemand for Academics에 대한 내용을 다루고 있습니다. 관련하여 궁금하신 점 있으시다면 KRContactCenter@sas.com 로 문의 부탁드리겠습니다. 감사합니다.
SAS에 대한 공개 무료 프로그램(OnDemand for Academics)의 소개
서울대 행정대학원 고길곤 교수
SAS에 대한 오해 중의 하나가 매우 비싸서 사용하기 어렵다는 것이다. 특히 대학교에서 SAS를 구매할 여력이 없는 경우 통계 수업에서 SAS를 사용하는 것은 불가능하다. 그 결과 많은 교수나 학생이 SAS를 사용하고 싶어도 사용할 수 없는 경우를 흔히 볼 수 있다. SAS에 대한 또 다른 오해는 SPSS나 엑셀처럼 마우스로 간단히 메뉴를 선택하여 분석을 하는 풀다운 방식의 분석이 어렵다는 점이다. 프로그램 창에 어려운 코드를 짜야 분석할 수 있다는 선입견을 갖고 있는 것이다.
SAS의 OnDemand For Academics(이하 SAS ODA)는 SAS에 대한 두 가지 오해를 풀어주는 새로운 개념의 클라우드 기반 프로그램이다. 첫째, SAS ODA는 무료다. 물론 SAS ODA 이전에도 SAS는 학생들이 손쉽게 사용할 수 있도록 University Edition을 무료로 제공해왔다. 이 프로그램은 Virtualbox와 같은 가상머신(virtual machine)을 설치한 후 이를 기반으로 SAS Studio가 구동되는 방식으로 작동되었다. 그러나 가상머신 설치단계에서 오류가 자주 발생하였으며, 웹브라우져에서 가상머신이 구동될 때 프로그램이 정지되는 현상도 종종 발생하였다. 그 결과 2021년 8월부터 서비스를 종료하고 ODA 기반의 무료 SAS 프로그램을 공급하기 시작하였다. ODA는 프로그램을 설치하는 것이 아니라 계정 신청을 한 후 온라인으로 클라우드에 접속해서 SAS Studio를 활용하는 방식이다. 따라서 무거운 SAS 프로그램을 개인 컴퓨터에 설치하지 않아도 되고 인터넷 접속만 되면 어디서나 SAS를 활용할 수 있다는 장점이 있다.
둘째, SAS Studio에서는 풀다운 메뉴방식과 프로그램 윈도우에 코드를 직접 입력 방식을 모두 사용할 수 있다. 데이터처리부터 다변량 시계열분석, 네트워크 최적화까지 매우 다양한 모형을 SPSS에서 사용하는 풀다운 메뉴 방식으로 분석할 수 있다. 따라서 마우스로 종속변수와 독립변수를 지정하고 옵션들을 선택하면 손쉽게 분석 결과를 얻을 수 있다. 또한 풀다운 메뉴를 사용하더라도 SAS 코드가 자동으로 함께 생성되기 때문에 프로그램 윈도우에 코드를 입력하는 것을 선호하는 사용자에게도 매우 유용하다. 게다가 프로그램 윈도우에서 코드를 입력할 때 명령어 자동완성 기능을 제공하여, 명령어를 입력하면 자동으로 해당 명령어와 관련된 각종 옵션들을 보여준다.
그림 1 SAS ODA 환경하에서 SAS Studio 작업 환경
셋째, 파이썬(Python) 사용자들이 SAS를 함께 사용할 수 있게 한다는 점도 큰 장점이다. 파이썬은 신속하게 새로운 자료분석 제공하기 때문에 이를 SAS의 각종 검증된 프로시저와 함께 사용할 수 있는 장점이 있다. 또한 R 사용자들이 유용하게 사용하는 마크다운(mark down) 기능을 지원하는 주피터 노트북(Jupyter Notebook)도 사용 가능하다. 주피터 노트북은 코드와 코드를 실행시킨 결과를 함께 볼 수 있는 장점이 있어 널리 사용되고 있다.
현재 SAS ODA는 클라우드에 저장할 수 있는 자료의 용량을 제한하고 있는데 5Gb 정도의 자료 제공 용량은 기본으로 제공하고 있기 때문에 자료 분석에 큰 지장이 없다. 또한 SAS의 클라우드 서버에서 연산을 하기 때문에 연산 속도도 빠르다는 장점이 있다. 클라우드 환경하에서 SAS 프로그램을 구동하는 것은 앞으로 보편화 될 것으로 보인다. 현재 SAS가 3세대 프로그램이라고 부르는 SAS Viya를 지속적으로 개선시키고 있는데 빅데이터 분석을 위한 멀티 쓰레드(multithread) 기능을 제공하기 때문에 연산속도가 탁월해지고 있다. SAS ODA는 Viya와 매우 유사한 프로그램 환경을 가진 것도 장점이다.
안타깝게도 기존의 SAS 사용자들은 여전히 고전적인 프로그램 윈도우 방식을 선호하고 있고, SAS ODA를 강의나 연구에 적극적으로 사용하는 경우가 많지 않다. 일부에서는 여전히 SAS는 데이터 시각화 수준이 떨어진다고 생각하기도 한다. 하지만 SGPLOT나 SGMAP 프로시저 기능을 이용해본 사람들은 SAS가 제공하는 강력한 데이터 시각화 기능과 GIS 기능에 놀랄 것이다. 저자가 ‘데이터 시각화와 자료분석’(문우사)이라는 책을 쓴 이유도 SAS의 데이터 시각화 기능을 조금이라도 소개해보고자 했기 때문이다.
통계학을 처음 배우는 학생부터 고급 이용자에게 SAS ODA는 훌륭한 분석 환경을 제공하고 있다. 앞으로 더 많은 데이터 어낼리틱스 전문가들이 SAS가 제공하는 안정되고 신뢰성 높은 통계분석 모듈들을 이용하기를 기대한다.