이번 게시글은 [ SAS Viya ] Visual Analytics part1의 이어지는 글로 SAS Viya를 통해 활용할 수 있는 통계적 기법들을 설명합니다.
6. Line Charts
차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.
일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다.
* 주요 특성
- 정보의 흐름을 연속적인 선으로 표현을 했을 때 의미가 생기는 데이터를
상대로 정보의 변화 추이를 관측
- 일반적으로 시간의 변화에 따른 데이터 추이를 분석하는데 활용* 차트 활용 분야
* Big Data 활용 분야
•선이라고 하는 요소가 가진 단순함을 기본으로 하는 모든 종류의 Big Data 시각화에 활용
막대차트의 상단 꼭지점을 서로 이어 값의 많고 적음을 판단하는 기준지표로 활용 됨
7. Spatial Charts
차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.
일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다.
* 주요 특성
- 데이터를 분석하는 하나의 관점
- 다각도로 데이터 분석 (ex.기간별/제품별/고객별 매출)
- 둘 이상의 차원이 만들어 내는 ‘면’, 혹은 ‘부피’에 해당하는 영역
- 이 영역이 무수히 많은 점(데이터)로 가득 차 있다는 전제
- 셋 이상의 차원이 결합하여 생성하는 3차원의 공간.
- 공간상에 존재하는 점(Spot), 혹은 면(face)을 활용하여 차트 생성
가능. 셋 이상의 차원을 활용한 차트는 오히려 가독성이 떨어짐
* 차트 활용 분야
* Big Data 활용 분야
8.TimeLine
시간의 변화에 따른 데이터 속성의 좌표를 선으로 이어 정보 변동의 추이나 트랜드를 추정하고 미래의 예측값을 유추하는데 활용하는 도표
* 주요 특성
시계열 정보 제공
- 시간 흐름에 따른 정보의 변화 추이를 판단하고 단위 변화에 따른 패턴 유추
- 과거의 패턴을 기반으로 미래의 예측모델 생성에 활용
- 단일 라인이 아닌 복수의 라인을 이용하여 각 속성별 시간변화 추이를 비교하고 시계열적 패턴 추출에 용이.
* 차트 활용 분야
* BigData 활용 분야
시간 변화에 의미를 가지는 모든 종류의 데이터 분석의 기본 도표
- ex. 시간대별 제조 공정 생산율 추이 분석 등
9. Decision Tree
여러 의사결정 대안과 발생 가능한 사건간의 주요한 상호작용을 보여주는 다이어그램으로 트리의 가지는 의사결정 대안이나 발생 가능한 사건을 나타냄
* 주요 특성
원인 추적에 용이
- 발생 가능한 모든 경우의 수를 시각적으로 빠르게 판단 할 수
있기 때문에 문제의 원인을 파악하는데 용이함.
- 계층을 기반으로 하는 데이터 구조의 성격으로 상 하위 노드 간의
연관 관계를 판단하는데 용이함.
Summarize의 사각에서 벗어남
- 집계가 되어 있는 데이터가 가지는 한계를 뛰어넘어 세부 정보까지
접근하여 정확한 의사 결정에 도움을 줌.
* 차트 활용 분야
변수들 사이의 속성들 중 가장 많은 데이터 건수를 가지는 항목에 대해 선의 굵기로 표현을 해고 굵은 선의 경로를 추적해보면 전체 데이터가 가지는 패턴을 확인 가능함
* BigData 활용 분야
- ex. 공정의 오류 패턴 -> 공정 노드별 오류 패턴(Drill Up/Down)
10. Heatmap
두 개의 변수를 대상으로 색상 테이블을 이용하여 데이터 값의 분포를 한눈에 파악 할 수 있는 시각화 방법입니다.
* 주요 특성
시각적 특성
- Heatmap(열지도)에는 색상 셀이 있는 테이블을 사용하여 두 개의 데이터 항목에 대한 값 분포가 표시됨. 색상 데이터 역할에 측도를 할당하지 않는 경우 셀 색상은 값의 각 교차점 빈도를 나타냅니다.
- 색상 데이터 역할에 측도를 할당하는 경우 셀 색상은 값의 각 교차점에 대한 집계 측도 값을 나타냅니다.
시각화 비교
- 서로 다른 복수의 (ex. 남, 여) Heatmap을 통한 효과적인 비교
* 차트 활용 분야
각 속성의 교차점에 대한 빈도나 데이터 값을 색상 분포를 통해 표현
- ex. 자주 자용되는 모듈이나 페이지의 빈도를 Red->Blue로 표현 등
* BigData 활용 분야
색상을 통한 데이터 표현은 대량의 변수에 대한 정보 이해도를 높임.
- ex. 여러 개의 속성을 가지는 데이터(설비 Output 데이터 등)에 대한 패턴
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9.
Early bird rate extended! Save $200 when you sign up by March 31.