안녕하세요.
MYSAS 홍보대사 최준입니다.
학계의 교수님과 학생들의 간편한 SAS 사용을 위하여 SAS University Edition 무료 소프트웨어가 출시되었습니다.
SAS University Edition은 직관적인 UI 환경이기 때문에 쉽게 사용할 수 있지만,
아직까지 많은 홍보가 되지는 않은 것 같습니다.
그래서 제가 미흡하지만, SAS University Edition 사용법, 및 기능에 대해서 연재해보고 있습니다.
이번 시간에는 히스토그램과 시계열 그래프 작성 기능에 대해서 살펴보겠습니다.
작업 -> 그래프 -> 히스토그램을 드래그하면 다음과 같은 창이 형성됩니다.
만약 SASHELP 라이브러리에 있는 CARS 데이터의 MPG_CITY의 히스토그램을 보고 싶다면
아래와 같은 과정을 따라하시면 됩니다.
먼저 데이터 창에서 SASHELP.CARS 데이터를 불러온 후에
역할 -> 분석변수에서 분석하고 싶은 변수인 MPG_Cty를 설정합니다.
그후에 실행을 하면
다음과 같은 히스토그램이 결과창에 형성됨을 확인할 수 있습니다.
이번에는 그려진 히스토그램을 옵션을 사용하여 좀 더 직관적으로 알아보기 쉽게
수정하는 작업을 해보겠습니다.
옵션탭에서는 히스토그램을 만들때 적용할 수 있는 다양한 옵션들이 있고, 이 옵션들을 이용하면
쉽게 히스토그램을 수정할 수 있습니다.
SAS University Edition의 가장 큰 장점 중 하나는 오른쪽 부분에 보이듯이 SAS 코드를 제공해주는 점입니다!!!
(사실 저에게 있어서 이부분은 가장 중요한 부분입니다.
SAS University Edition을 잘 사용한다면, SAS 코드를 만드는데도 많은 도움이 될 수 있기 때문이죠!)
위의 그림을 실행하면 다음과 같은 히스토그램이 형성됩니다.
히스토그램을 통해 우리는 이상치를 발견할 수 있습니다.
다음과 같은 방법을 통해서 이상치를 제거할 수도 있습니다.
라이브러리에서 Cars 데이터를 불러온 후에 MPG_City>50이상인 변수를 필터링 해보면
MPG_Cityrk 50이상인 관측치의 Type변수는 Hybrid임을 확인할 수 있습니다.
위의 코드는 type이 Hybrid인 관측치를 제외한 sashelp.cars 데이터에서 work.cars데이터로 저장하는 코드입니다.
work.cars 데이터를 다시 히스토그램을 그려준다면,
다음과 같이 이상치가 제거된 히스토그램이 만들어짐을 확인할 수 있습니다.
제가 사용한 옵션 외에도 정말 많은 여러가지 옵션들이 있으니 한번 사용해보시길 추천해드립니다.
기타 궁금하신 점이 있으시다면
언제든지 저에게 쪽지 or 댓글로 문의해주시면 친절하게 답변해드리겠습니다.
감사합니다.
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.