BookmarkSubscribeRSS Feed

[ SAS Viya ] Visual Analytics part2

Started ‎02-13-2021 by
Modified ‎02-13-2021 by
Views 364

 

이번 게시글은 [ SAS Viya ] Visual Analytics part1의 이어지는 글로 SAS Viya를 통해 활용할 수 있는 통계적 기법들을 설명합니다.

 

6. Line Charts

차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.

일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다.

 

* 주요 특성 

  • 연속적 성격의 정보 제공

    - 정보의 흐름을 연속적인 선으로 표현을 했을 때 의미가 생기는 데이터를

     상대로 정보의 변화 추이를 관측

    - 일반적으로 시간의 변화에 따른 데이터 추이를 분석하는데 활용
  • 선으로 표현되는 모든 종류의 차트의 통칭
  • 일반적으로는 시계열 차트의 다른 이름으로 인지 되지만 정의의 관점으로  네트워크 차트 등의 선이 구성요소로 활용되는 모든 종류의 차트를 통칭하는 개념

* 차트 활용 분야

  • 시간이나 단위의 변화에 따른 변수의 변동을 추적하는데 용이

* Big Data 활용 분야

  • •선이라고 하는 요소가 가진 단순함을 기본으로 하는 모든 종류의 Big Data 시각화에 활용

  • 막대차트의 상단 꼭지점을 서로 이어 값의 많고 적음을 판단하는 기준지표로 활용 됨

 

그림1.png그림2.png 

 

 

7.  Spatial Charts

차트에 ‘공간’이라고 하는 개념을 도입하여 정보를 판단하는데 유용한 형태의 시각화를 생산하는 도표입니다.

일반적으로 평면도나 네트워크 차트, Geometry 차트가 있습니다. 

 

* 주요 특성

  • 차원

    - 데이터를 분석하는 하나의 관점

    - 다각도로 데이터 분석 (ex.기간별/제품별/고객별 매출)

  • 공간

    - 둘 이상의 차원이 만들어 내는 ‘면’, 혹은 ‘부피’에 해당하는 영역

     - 이 영역이 무수히 많은 점(데이터)로 가득 차 있다는 전제

  • Three - Dimensional Space(3D)

     - 셋 이상의 차원이 결합하여 생성하는 3차원의 공간.

     - 공간상에 존재하는 점(Spot), 혹은 면(face)을 활용하여 차트 생성

        가능. 셋 이상의 차원을 활용한 차트는 오히려 가독성이 떨어짐

* 차트 활용 분야 

  • 기상지도나 건축도면 등 공간에 의미를 부여 해야 하는 분석에 활용
  • 정보의 분석 보다는 형태나 모양의 파악이나 분석에 적합한 차트

* Big Data 활용 분야

  • 3D 입체 차트를 활용한 분석
  • ex. 제조기기 온도 분포 출력 데이터 분석, 건축물 입체 하중 분포 분석 등.

그림1.png

 

8.TimeLine

 

시간의 변화에 따른 데이터 속성의 좌표를 선으로 이어 정보 변동의 추이나 트랜드를 추정하고 미래의 예측값을 유추하는데 활용하는 도표

 

* 주요 특성

  • 시계열 정보 제공

      - 시간 흐름에 따른 정보의 변화 추이를 판단하고 단위 변화에 따른 패턴 유추

      - 과거의 패턴을 기반으로 미래의 예측모델 생성에 활용

  • 복수의 속성값들의 시간 변화에 따른 변화를 비교

    - 단일 라인이 아닌 복수의 라인을 이용하여 각 속성별 시간변화 추이를 비교하고 시계열적 패턴 추출에 용이.

* 차트 활용 분야

  • 일반적으로 Line 차트의 활용과 유사하나 분석 관점이 시간으로 제한됨
  • 과거의 데이터 추이 속에서 미래 데이터의 예상이나 분석에 활용 됨.

* BigData 활용 분야 

  • 시간 변화에 의미를 가지는 모든 종류의 데이터 분석의 기본 도표

      - ex. 시간대별 제조 공정 생산율 추이 분석 등

 

그림1.png

 

그림2.png

 

9. Decision Tree

여러 의사결정 대안과 발생 가능한 사건간의 주요한 상호작용을 보여주는 다이어그램으로 트리의 가지는 의사결정 대안이나 발생 가능한 사건을 나타냄

 

* 주요 특성

  • 원인 추적에 용이

      - 발생 가능한 모든 경우의 수를 시각적으로 빠르게 판단 할 수

        있기 때문에 문제의 원인을 파악하는데 용이함.

      - 계층을 기반으로 하는 데이터 구조의 성격으로 상 하위 노드 간의

        연관 관계를 판단하는데 용이함.

  •  Summarize의 사각에서 벗어남

     - 집계가 되어 있는 데이터가 가지는 한계를 뛰어넘어 세부 정보까지

        접근하여 정확한 의사 결정에 도움을 줌.

     

 * 차트 활용 분야

  • 변수들 사이의 속성들 중 가장 많은 데이터 건수를 가지는 항목에 대해 선의 굵기로 표현을 해고 굵은 선의 경로를 추적해보면 전체 데이터가 가지는 패턴을 확인 가능함

* BigData 활용 분야

  • 계층 구조를 가지는 데이터에 대하여 Drill-Down을 통해 문제의 원인에 접근
  •   - ex. 공정의 오류 패턴 -> 공정 노드별 오류 패턴(Drill Up/Down)

그림1.png

 

 

10. Heatmap

두 개의 변수를 대상으로 색상 테이블을 이용하여 데이터 값의 분포를 한눈에 파악 할 수 있는 시각화 방법입니다.

 

* 주요 특성

  • 시각적 특성

      - Heatmap(열지도)에는 색상 셀이 있는 테이블을 사용하여 두 개의 데이터 항목에 대한 값 분포가 표시됨. 색상 데이터 역할에 측도를 할당하지 않는 경우 셀 색상은 값의 각 교차점 빈도를 나타냅니다.

      - 색상 데이터 역할에 측도를 할당하는 경우 셀 색상은 값의 각 교차점에 대한 집계 측도 값을 나타냅니다.

  • 시각화 비교

      - 서로 다른 복수의 (ex. 남, 여) Heatmap을 통한 효과적인 비교

* 차트 활용 분야

  • 각 속성의 교차점에 대한 빈도나 데이터 값을 색상 분포를 통해 표현

      - ex. 자주 자용되는 모듈이나 페이지의 빈도를 Red->Blue로 표현 등

* BigData 활용 분야

  • 색상을 통한 데이터 표현은 대량의 변수에 대한 정보 이해도를 높임.

      - ex. 여러 개의 속성을 가지는 데이터(설비 Output 데이터 등)에 대한 패턴

그림1.png

 

그림2.png

 

Version history
Last update:
‎02-13-2021 07:46 AM
Updated by:
Contributors

Ready to join fellow brilliant minds for the SAS Hackathon?

Build your skills. Make connections. Enjoy creative freedom. Maybe change the world. Registration is now open through August 30th. Visit the SAS Hackathon homepage.

Register today!
Article Labels
Article Tags