BookmarkSubscribeRSS Feed

데이터 시각화 graph(1)

Started ‎06-16-2020 by
Modified ‎06-16-2020 by
Views 2,872

데이터 시각화: graph(1)

 

안녕하세요^^

오늘은 간단한 데이터 시각화에 대해 알아보도록 하겠습니다.

​​데이터를 분석하는 것만큼 중요한 것이 결과를 잘 표현하는 것입니다.

​따라서 이번 시간부터 3시간에 걸쳐 SAS의 GCHART프로시저를 통해 데이터를 시각화 하는 간단한 방법에 대해 공부하도록 하겠습니다.

​이번에 다루게 될 프로시저는 PROC GCHART로 세로축, 가로축 막대 그래프, PIE그래프 등을 그릴 수 있습니다.

오늘은 첫 번째 시간으로 가장 간단한 세로축 그래프에 대한 내용으로 시작하겠습니다.

먼저 데이터는 이름, 성별, 나이, 신장, 체중으로 이루어진 데이터를 사용하겠습니다.

 

SE22016061913325070.jpg

이는 데이터의 일부만 PROC PRINT 프로시저를 통해 보인 것입니다.

 

===========================================================================

 

 

SE22016061913383970.jpg

 

가장 간단하게는

​PROC GCHART의 VBAR문장을 사용하여 세로축 BAR GRAPH를 그릴 수 있습니다.

​Default로는 세로축에 빈도에 해당하는 값이 지정되며, 가로축이 연속형인 경우 중앙값을 자동으로 계산하여 그래프가 그려집니다.

 

SE22016061913391070.jpg

 

 

 

SE22016061913392370.jpg

 

가로축을 연속형에서 이산형으로 바꿀 수 있는 옵션은 VAR문장의 discrete 옵션입니다.

이처럼 discrete 옵션을 지정하면 변수 값을 이산형으로 취급하여 가로축을 설정합니다.

 

SE22016061913394170.jpg

 

 

 

SE22016061913395370.jpg

 

또는, 그래프의 막대 개수를 지정할 수 도 있습니다.

Levels 옵션을 사용하면 막대의 개수를 원하는 수로 지정할 수 있습니다.

 

SE22016061913401270.jpg

 

 

 

SE22016061913411970.jpg

 

그래프에 값에 대한 정보를 추가할 때에는, inside 옵션을 사용합니다.

이 예시와 같이 각각이 차지하는 퍼센트를 나타낼 때에는 Inside=percent를 사용합니다.

Percent 외에도 freq, sum 등을 사용할 수 있습니다.

 

SE22016061913415770.jpg

 

 

 

SE22016061913420970.jpg

 

앞서 inside옵션에 freq를 사용할 수 있다고 했는데, 이 예제가 freq를 사용한 결과입니다.

 

SE22016061913423270.jpg

 

 

 

SE22016061913424670.jpg

 

추가적으로, cfreq를 사용하면, cumulative frequency 값이 막내 내부에 쓰여진 그래프를 그릴 수 있습니다.

 

SE22016061913425470.jpg

 

 

 

SE22016061913430670.jpg

 

이제 gchart에서 사용할 수 있는 옵션에 대해 알아보도록 하겠습니다.

​기본적으로, pattern옵션의 color를 사용하여 막대의 색을 변경할 수 있습니다.

​또한, Axis옵션과 maxis, raxis 옵션을 사용하여 축 이름과 축에 나타나는 수치 등을 변경할 수 있습니다.

​Axis1은 왼쪽 세로축이며 나타내고 싶은 변수를 지정할때 raxis에 사용하며, axis2는 아래쪽 가로축이며 기준이 되는 변수를 지정할 때 maxis에 사용합니다.

 

SE22016061913435370.jpg

 

 

 

SE22016061913440670.jpg

 

width 옵션을 사용하여 전체적인 그래프의 가로길이를 조절할 수 있습니다.

​또한 group옵션을 사용하여, group별로 그래프를 표현할 수도 있습니다.

예시에서는 group을 sex로 하여 female일 때와 male일 때의 각각의 age에 대한 빈도표를 작성하였습니다.

 

SE22016061913443070.jpg

 

 

 

SE22016061913444270.jpg

 

추가적으로 subgroup옵션을 사용하면 group옵션과는 다르게 전체 그래프를 subgroup별로 구분 할 수 있습니다.

 

SE22016061913445770.jpg

 

 

===========================================================================

 

 

 

​이상 간단한 세로 막대 그래프를 그리는 방법과 옵션들에 대해 알아보았습니다.

다음 시간에는 세로 막대 그래프의 세로축을 빈도가 아닌 값으로 지정하는 방법과 가로 막대 그래프를 그리는 방법에 대해 알아보도록 하겠습니다.

Version history
Last update:
‎06-16-2020 05:21 AM
Updated by:
Contributors

sas-innovate-white.png

Our biggest data and AI event of the year.

Don’t miss the livestream kicking off May 7. It’s free. It’s easy. And it’s the best seat in the house.

Join us virtually with our complimentary SAS Innovate Digital Pass. Watch live or on-demand in multiple languages, with translations available to help you get the most out of every session.

 

Register now!

Article Labels
Article Tags