이번 게시글은 [ SAS Viya ] Visual Analytics part1의 이어지는 글로 SAS Viya를 통해 활용할 수 있는 통계적 기법들을 설명합니다.
6. Line Charts
차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.
일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다.
* 주요 특성
- 정보의 흐름을 연속적인 선으로 표현을 했을 때 의미가 생기는 데이터를
상대로 정보의 변화 추이를 관측
- 일반적으로 시간의 변화에 따른 데이터 추이를 분석하는데 활용* 차트 활용 분야
* Big Data 활용 분야
•선이라고 하는 요소가 가진 단순함을 기본으로 하는 모든 종류의 Big Data 시각화에 활용
막대차트의 상단 꼭지점을 서로 이어 값의 많고 적음을 판단하는 기준지표로 활용 됨
7. Spatial Charts
차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.
일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다.
* 주요 특성
- 데이터를 분석하는 하나의 관점
- 다각도로 데이터 분석 (ex.기간별/제품별/고객별 매출)
- 둘 이상의 차원이 만들어 내는 ‘면’, 혹은 ‘부피’에 해당하는 영역
- 이 영역이 무수히 많은 점(데이터)로 가득 차 있다는 전제
- 셋 이상의 차원이 결합하여 생성하는 3차원의 공간.
- 공간상에 존재하는 점(Spot), 혹은 면(face)을 활용하여 차트 생성
가능. 셋 이상의 차원을 활용한 차트는 오히려 가독성이 떨어짐
* 차트 활용 분야
* Big Data 활용 분야
8.TimeLine
시간의 변화에 따른 데이터 속성의 좌표를 선으로 이어 정보 변동의 추이나 트랜드를 추정하고 미래의 예측값을 유추하는데 활용하는 도표
* 주요 특성
시계열 정보 제공
- 시간 흐름에 따른 정보의 변화 추이를 판단하고 단위 변화에 따른 패턴 유추
- 과거의 패턴을 기반으로 미래의 예측모델 생성에 활용
- 단일 라인이 아닌 복수의 라인을 이용하여 각 속성별 시간변화 추이를 비교하고 시계열적 패턴 추출에 용이.
* 차트 활용 분야
* BigData 활용 분야
시간 변화에 의미를 가지는 모든 종류의 데이터 분석의 기본 도표
- ex. 시간대별 제조 공정 생산율 추이 분석 등
9. Decision Tree
여러 의사결정 대안과 발생 가능한 사건간의 주요한 상호작용을 보여주는 다이어그램으로 트리의 가지는 의사결정 대안이나 발생 가능한 사건을 나타냄
* 주요 특성
원인 추적에 용이
- 발생 가능한 모든 경우의 수를 시각적으로 빠르게 판단 할 수
있기 때문에 문제의 원인을 파악하는데 용이함.
- 계층을 기반으로 하는 데이터 구조의 성격으로 상 하위 노드 간의
연관 관계를 판단하는데 용이함.
Summarize의 사각에서 벗어남
- 집계가 되어 있는 데이터가 가지는 한계를 뛰어넘어 세부 정보까지
접근하여 정확한 의사 결정에 도움을 줌.
* 차트 활용 분야
변수들 사이의 속성들 중 가장 많은 데이터 건수를 가지는 항목에 대해 선의 굵기로 표현을 해고 굵은 선의 경로를 추적해보면 전체 데이터가 가지는 패턴을 확인 가능함
* BigData 활용 분야
- ex. 공정의 오류 패턴 -> 공정 노드별 오류 패턴(Drill Up/Down)
10. Heatmap
두 개의 변수를 대상으로 색상 테이블을 이용하여 데이터 값의 분포를 한눈에 파악 할 수 있는 시각화 방법입니다.
* 주요 특성
시각적 특성
- Heatmap(열지도)에는 색상 셀이 있는 테이블을 사용하여 두 개의 데이터 항목에 대한 값 분포가 표시됨. 색상 데이터 역할에 측도를 할당하지 않는 경우 셀 색상은 값의 각 교차점 빈도를 나타냅니다.
- 색상 데이터 역할에 측도를 할당하는 경우 셀 색상은 값의 각 교차점에 대한 집계 측도 값을 나타냅니다.
시각화 비교
- 서로 다른 복수의 (ex. 남, 여) Heatmap을 통한 효과적인 비교
* 차트 활용 분야
각 속성의 교차점에 대한 빈도나 데이터 값을 색상 분포를 통해 표현
- ex. 자주 자용되는 모듈이나 페이지의 빈도를 Red->Blue로 표현 등
* BigData 활용 분야
색상을 통한 데이터 표현은 대량의 변수에 대한 정보 이해도를 높임.
- ex. 여러 개의 속성을 가지는 데이터(설비 Output 데이터 등)에 대한 패턴
Build your skills. Make connections. Enjoy creative freedom. Maybe change the world. Registration is now open through August 30th. Visit the SAS Hackathon homepage.
Register today!