BookmarkSubscribeRSS Feed

[SAS Viya] Visual Analytics part3

Started ‎02-14-2021 by
Modified ‎02-15-2021 by
Views 479

 

이번 게시글은 [ SAS Viya ] Visual Analytics part2의 이어지는 글로 SAS Viya를 통해 활용할 수 있는 통계적 기법들을 설명합니다.

 

11. Geo Map

지도상에 표현이 가능한 속성의 데이터를 실제 지도 위에서 차트 라이브러리를 활용해 정보를 표현하는 도구입니다.

 

* 주요 특성

  • 지리정보의 이해에 탁월한 효과
  •   - 지역이 가지는 속성에 대해 텍스트 형태의 데이터 보다는 색상이나 차트를 활용하여 지도위에 직접 표현하는 것이 이해를 돕는데 탁월한 효과를 지님

  • 지도위에서 구현되는 다양한 차트 라이브러리
      - 버블차트, HeatMap, TreeMap 등의 차트를 지도위에서 활용하게 되면 인접국가와의 연관관계나 지역간 차이 등을 확연하게 표현

* 차트 활용 분야

  • 데이터의 속성이 지역에 관한 내용이라면 활용도가 높은 차트 방식
  • 지도상에서의 Drilling을 통해 효과적인 데이터 분석이 가능

* BigData 활용 분야

다양한 국가에서 발생하는 대량의 데이터에 대해 하나의 지도 위에 표현 가능하기 때문에 새로운 인사이트 발굴에 탁월함

- ex. 국가별 지역별 공정 가동 현황 표현 등

 

그림1.png

 

12. Network Plot

각 노드간의 상관/연관 관계를 점, 선, 면을 활용해 표현하는 차트의 방식. 여러 노드간의 연관성을 거미줄(Web) 형태로 표현하는 하는 시각화 도구

 

* 주요 특성

  • 다양한 활용 분야

      - 연관을 가지는 다양한 노드를 2차원의 평면에 나열하기 때문에 수직적/수평적 연관성 분석에 유용합니다.

      - 단어간의 연관, 지역간의 연관, 변수간의 연관 등을 시각적으로 판단하기 편리한 형태로 표현

  • 노드의 색상/사이즈와 라인의 굵기/색상을 활용한 시각화
      - 점, 선, 면에 데이터적인 의미를 부여하여 차트를 구성하기 때문에 시각적으로 탁월한 효과를 가져 올 수 있습니다.

* 차트 활용 분야

  • 노드간의 연관 관계를 표현하거나 정보의 흐름을 표현하는데 유리함

      활용한 분석 화면 구성

  • 노드의 크기, 색상에 의미를 부여하고 노드를 잇는 링크(선)의 길이와 두께를 활용한 분석 화면 구성

* BigData 활용 분야

  • 지도상의 네트워크 차트 표현 기능을 활용한 Big Data 시각화

       - 원자재 물류 현황 및 물류 방식 표현 등

그림1.png

그림2.png

 

 

13. Word Cloud

저장된 텍스트 데이터에 대하여 자동으로 형태소 분석을 진행하여 분류된 형태소의 빈도를 단어의 사이즈를 통해 시각화 하는 차트 도구

 

* 주요 특성

  • 텍스트의 빈도를 기반으로 한 분석

      - 국가 원수의 연설문 등을 형태소 분석하여 언급된 단어의 빈도를 통해 정치적 성향이나 관심 분야에 대한 파악 가능합니다

      - 텍스트/숫자의 분석에서 벗어나 텍스트 자체의 사이즈나 색상을 통해 의미를 전달하므로 데이터가 가진 근본 속성 접근에 용이합니다

  • 빈도 필터를 활용한 데이터 분석
      - 데이터에 포함된 단어의 빈도를 필터링 함으로써 보다 퀄리티 있는 정보를 추출하는데 용이합니다

* 차트 활용 분야

  • 문서에 표현된 단어의 빈도를 통해 문서의 전체 내용 파악에 유리 함

  • 빈도 파악과 동시에 변수의 항목에 따른 색상 구분도 가능하여 텍스트 기반의 데이터 분석에 용이 함.

그림2.png

* Big Data 활용 분야

  • 텍스트 형태로 저장된 모든 종류의 데이터에 대해 분석 가능

     - ex. 역대 대통령의 취임 연설 분석을 통해 정치 성향 도출 등

그림1.png

 

그림2.png

 

14. Correlation

각 측도간의 유의미한 상관관계를 Matrix 차트 형태로 시각화 해주는 도구로써 예상치 못했거나 판단 할 수 없었던 데이터간의 관계를 도출/이해 하는데 효과적인 차트 도구

 

* 주요 특성

  • 측도간의 관계 유추에 탁월한 기능

      - 각각의 측도가 가지는 데이터 속성이 다른 측도에 얼마나 유의한 관계성을 가지는지를 손쉽게 시각화 표현

  • 색상을 활용한 관계성 파악
      - 상관계수 등의 지표에 별다른 지식을 가지고 있지 않아도 색상이 전달하는 의미를 통해 차트 이해 가능

* 차트 활용 분야

  • 변수간의 상관 관계가 높고 낮음의 판단을 위한 시각화 도구

  • 상관 관계가 높은 변수의 관계를 기준으로 분석의 스토리를 만들어 가는 방식

* BigData 활용 분야

  • 다양한 측도의 병렬/복합 비교 기능을 활용해 Mining 수준의 분석 결과 예측

      - ex. 둘 이상의 공정 이상을 야기하는데 관계가 높은 변수의 추출 등

그림1.png

 

그림2.png

 

15. ggplot2

통계 언어 R을 위한 데이터 시각화 패키지로 간단한 통계 시각화 모듈과 웹 환경을 제공. 2005년 출시 이후로 R의 주요 패키지로 발전

 

* 주요 특성

  • 고가용성

     - base R graphic과는 달리 사용자들의 수정이나 추가 작업을 지원

  • R 기본 차트의 보완재
      - 기존 R에서는 구현하기 힘들었던 컴포넌트 지원

      - 상대적으로 복잡한 형태의 문법에도 대응 가능

* Big Data 활용 

  • R 분석 환경에서의 단순 시각화 도구

     - base R이 지원하지 않는 Graph/Graphic에 대한 패키지 활용

그림1.png

 

그림2.png

 

Version history
Last update:
‎02-15-2021 01:48 AM
Updated by:
Contributors

sas-innovate-white.png

Special offer for SAS Communities members

Save $250 on SAS Innovate and get a free advance copy of the new SAS For Dummies book! Use the code "SASforDummies" to register. Don't miss out, May 6-9, in Orlando, Florida.

 

View the full agenda.

Register now!

Article Labels
Article Tags