데이터 시각화: graph(1)
안녕하세요^^
오늘은 간단한 데이터 시각화에 대해 알아보도록 하겠습니다.
데이터를 분석하는 것만큼 중요한 것이 결과를 잘 표현하는 것입니다.
따라서 이번 시간부터 3시간에 걸쳐 SAS의 GCHART프로시저를 통해 데이터를 시각화 하는 간단한 방법에 대해 공부하도록 하겠습니다.
이번에 다루게 될 프로시저는 PROC GCHART로 세로축, 가로축 막대 그래프, PIE그래프 등을 그릴 수 있습니다.
오늘은 첫 번째 시간으로 가장 간단한 세로축 그래프에 대한 내용으로 시작하겠습니다.
먼저 데이터는 이름, 성별, 나이, 신장, 체중으로 이루어진 데이터를 사용하겠습니다.
이는 데이터의 일부만 PROC PRINT 프로시저를 통해 보인 것입니다.
===========================================================================
가장 간단하게는
PROC GCHART의 VBAR문장을 사용하여 세로축 BAR GRAPH를 그릴 수 있습니다.
Default로는 세로축에 빈도에 해당하는 값이 지정되며, 가로축이 연속형인 경우 중앙값을 자동으로 계산하여 그래프가 그려집니다.
가로축을 연속형에서 이산형으로 바꿀 수 있는 옵션은 VAR문장의 discrete 옵션입니다.
이처럼 discrete 옵션을 지정하면 변수 값을 이산형으로 취급하여 가로축을 설정합니다.
또는, 그래프의 막대 개수를 지정할 수 도 있습니다.
Levels 옵션을 사용하면 막대의 개수를 원하는 수로 지정할 수 있습니다.
그래프에 값에 대한 정보를 추가할 때에는, inside 옵션을 사용합니다.
이 예시와 같이 각각이 차지하는 퍼센트를 나타낼 때에는 Inside=percent를 사용합니다.
Percent 외에도 freq, sum 등을 사용할 수 있습니다.
앞서 inside옵션에 freq를 사용할 수 있다고 했는데, 이 예제가 freq를 사용한 결과입니다.
추가적으로, cfreq를 사용하면, cumulative frequency 값이 막내 내부에 쓰여진 그래프를 그릴 수 있습니다.
이제 gchart에서 사용할 수 있는 옵션에 대해 알아보도록 하겠습니다.
기본적으로, pattern옵션의 color를 사용하여 막대의 색을 변경할 수 있습니다.
또한, Axis옵션과 maxis, raxis 옵션을 사용하여 축 이름과 축에 나타나는 수치 등을 변경할 수 있습니다.
Axis1은 왼쪽 세로축이며 나타내고 싶은 변수를 지정할때 raxis에 사용하며, axis2는 아래쪽 가로축이며 기준이 되는 변수를 지정할 때 maxis에 사용합니다.
width 옵션을 사용하여 전체적인 그래프의 가로길이를 조절할 수 있습니다.
또한 group옵션을 사용하여, group별로 그래프를 표현할 수도 있습니다.
예시에서는 group을 sex로 하여 female일 때와 male일 때의 각각의 age에 대한 빈도표를 작성하였습니다.
추가적으로 subgroup옵션을 사용하면 group옵션과는 다르게 전체 그래프를 subgroup별로 구분 할 수 있습니다.
===========================================================================
이상 간단한 세로 막대 그래프를 그리는 방법과 옵션들에 대해 알아보았습니다.
다음 시간에는 세로 막대 그래프의 세로축을 빈도가 아닌 값으로 지정하는 방법과 가로 막대 그래프를 그리는 방법에 대해 알아보도록 하겠습니다.
Don’t miss the livestream kicking off May 7. It’s free. It’s easy. And it’s the best seat in the house.
Join us virtually with our complimentary SAS Innovate Digital Pass. Watch live or on-demand in multiple languages, with translations available to help you get the most out of every session.