이번 게시글은 [ SAS Viya ] Visual Analytics part2의 이어지는 글로 SAS Viya를 통해 활용할 수 있는 통계적 기법들을 설명합니다.
11. Geo Map
지도상에 표현이 가능한 속성의 데이터를 실제 지도 위에서 차트 라이브러리를 활용해 정보를 표현하는 도구입니다.
* 주요 특성
- 지역이 가지는 속성에 대해 텍스트 형태의 데이터 보다는 색상이나 차트를 활용하여 지도위에 직접 표현하는 것이 이해를 돕는데 탁월한 효과를 지님
지도위에서 구현되는 다양한 차트 라이브러리
- 버블차트, HeatMap, TreeMap 등의 차트를 지도위에서 활용하게 되면 인접국가와의 연관관계나 지역간 차이 등을 확연하게 표현
* 차트 활용 분야
* BigData 활용 분야
다양한 국가에서 발생하는 대량의 데이터에 대해 하나의 지도 위에 표현 가능하기 때문에 새로운 인사이트 발굴에 탁월함
- ex. 국가별 지역별 공정 가동 현황 표현 등
12. Network Plot
각 노드간의 상관/연관 관계를 점, 선, 면을 활용해 표현하는 차트의 방식. 여러 노드간의 연관성을 거미줄(Web) 형태로 표현하는 하는 시각화 도구
* 주요 특성
다양한 활용 분야
- 연관을 가지는 다양한 노드를 2차원의 평면에 나열하기 때문에 수직적/수평적 연관성 분석에 유용합니다.
- 단어간의 연관, 지역간의 연관, 변수간의 연관 등을 시각적으로 판단하기 편리한 형태로 표현
노드의 색상/사이즈와 라인의 굵기/색상을 활용한 시각화
- 점, 선, 면에 데이터적인 의미를 부여하여 차트를 구성하기 때문에 시각적으로 탁월한 효과를 가져 올 수 있습니다.
* 차트 활용 분야
노드간의 연관 관계를 표현하거나 정보의 흐름을 표현하는데 유리함
활용한 분석 화면 구성
노드의 크기, 색상에 의미를 부여하고 노드를 잇는 링크(선)의 길이와 두께를 활용한 분석 화면 구성
* BigData 활용 분야
지도상의 네트워크 차트 표현 기능을 활용한 Big Data 시각화
- 원자재 물류 현황 및 물류 방식 표현 등
13. Word Cloud
저장된 텍스트 데이터에 대하여 자동으로 형태소 분석을 진행하여 분류된 형태소의 빈도를 단어의 사이즈를 통해 시각화 하는 차트 도구
* 주요 특성
텍스트의 빈도를 기반으로 한 분석
- 국가 원수의 연설문 등을 형태소 분석하여 언급된 단어의 빈도를 통해 정치적 성향이나 관심 분야에 대한 파악 가능합니다
- 텍스트/숫자의 분석에서 벗어나 텍스트 자체의 사이즈나 색상을 통해 의미를 전달하므로 데이터가 가진 근본 속성 접근에 용이합니다
빈도 필터를 활용한 데이터 분석
- 데이터에 포함된 단어의 빈도를 필터링 함으로써 보다 퀄리티 있는 정보를 추출하는데 용이합니다
* 차트 활용 분야
문서에 표현된 단어의 빈도를 통해 문서의 전체 내용 파악에 유리 함
빈도 파악과 동시에 변수의 항목에 따른 색상 구분도 가능하여 텍스트 기반의 데이터 분석에 용이 함.
* Big Data 활용 분야
텍스트 형태로 저장된 모든 종류의 데이터에 대해 분석 가능
- ex. 역대 대통령의 취임 연설 분석을 통해 정치 성향 도출 등
14. Correlation
각 측도간의 유의미한 상관관계를 Matrix 차트 형태로 시각화 해주는 도구로써 예상치 못했거나 판단 할 수 없었던 데이터간의 관계를 도출/이해 하는데 효과적인 차트 도구
* 주요 특성
측도간의 관계 유추에 탁월한 기능
- 각각의 측도가 가지는 데이터 속성이 다른 측도에 얼마나 유의한 관계성을 가지는지를 손쉽게 시각화 표현
색상을 활용한 관계성 파악
- 상관계수 등의 지표에 별다른 지식을 가지고 있지 않아도 색상이 전달하는 의미를 통해 차트 이해 가능
* 차트 활용 분야
변수간의 상관 관계가 높고 낮음의 판단을 위한 시각화 도구
상관 관계가 높은 변수의 관계를 기준으로 분석의 스토리를 만들어 가는 방식
* BigData 활용 분야
다양한 측도의 병렬/복합 비교 기능을 활용해 Mining 수준의 분석 결과 예측
- ex. 둘 이상의 공정 이상을 야기하는데 관계가 높은 변수의 추출 등
15. ggplot2
통계 언어 R을 위한 데이터 시각화 패키지로 간단한 통계 시각화 모듈과 웹 환경을 제공. 2005년 출시 이후로 R의 주요 패키지로 발전
* 주요 특성
고가용성
- base R graphic과는 달리 사용자들의 수정이나 추가 작업을 지원
R 기본 차트의 보완재
- 기존 R에서는 구현하기 힘들었던 컴포넌트 지원
- 상대적으로 복잡한 형태의 문법에도 대응 가능
* Big Data 활용
R 분석 환경에서의 단순 시각화 도구
- base R이 지원하지 않는 Graph/Graphic에 대한 패키지 활용
Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.