SAS Viya 에서 SAS Data Explorer에서 고급 프로파일링 및 데이터 검색을 수행합니다. 이 결과 사용SAS 데이터 스튜디오에서 데이터를 변환하는 데이터 준비 계획을 세울 수 있습니다. 또한 보고서 또는 분석 모델 요구에 맞게 분석을 수행할 수 있습니다.
위는 SAS Viya의 첫 화면 입니다. 여기서 [새로운 계획]을 클릭합니다.
여러개의 Sample data 중 FASHION_INFLUENCER 데이터를 사용하여 데이터 준비 단계를 수행합니다.FASHION_INFLUENCER는 25개의 칼럼으로 구성되어 있습니다.
SAS VIYA 에서는 [상세정보] 탭, [미리보기 데이터] 탭, [프로파일] 탭이 을 통해 데이터를 살펴볼 수 있습니다.
[상세정보] 탭에서는 작업할 메모리 내 데이터 세트를 검색할 수 있습니다. 해당 테이블의 열 이름, 데이터 유형, 프로파일링된 시점, 열의 수, 행의 수 및 테이블의 크기 등 해당 테이블에 대한 기본적인 정보들을 확인할 수 있습니다.
[미리보기] 탭에서는 테이블이 작업을 수행하려는 테이블인지 확인할 수 있습니다. 선택한 테이블의 데이터 샘플링을 표시합니다. 기본적으로 샘플의 크기는 100행이지만 이 숫자를 변경하고 새로 고침 버튼을 선택하면 다른 샘플 크기를 확인 할 수 있습니다 .
[프로파일] 탭은 데이터 패턴을 인식하고 데이터의 희소성(Scarcity in the data)를 확인할 수 있습니다. 또한 데이터에 대한 평규느 중위수, Mode, 기초 통계량을 검토하고 null, 데이터 공백 및 패턴 카운트를 수행합니다. 일부 metrics에는 수행되지 않을 수 있습니다. 즉, 데이터 유형 특정열을 drill-down 하여 해당 열을 볼 수 있습니다.
다시 [상세 정보] 탭으로 돌아와 [확인] 버튼을 클릭합니다.
[확인] 버튼을 클릭하면 선택된 데이터의 값을 확인할 수 있습니다.
변수 값을 [제거], [중복 제거], [칼럼 변환], [표준화] 작업을 수행할 수 있습니다.
데이터 분석에 앞서 데이터 변환을 할 수 있다.
SAS Viya 에서는 '변환' 카테고리에 [변환 추가] , [칼럼 변환], [사용자 정의 변환], [Data Quality 변환], [다중 입력 변환], [행 변환] 이 있습니다.
[Data Quality 변환] 은 데이터 작업으로 데이터를 표중화 계획을 설계하고 성별 분류를 위한 성별 분석 노드를 적용할 수 있으며 패턴 분석을 할 수 있으며 데이터 작업에 참조 사항이 될 수 있습니다. 또한, 데이터의 비즈니스 규칙 정의와 생성을 할 수 있으며 Data Management Servaer 와는 상호작용을 합니다.
데이터 변환을 시작하려면 먼저 중복 레코드를 제거해야 합니다.
중복 레코드를 제거하기 위해서는 매치코드를 통해 작업을 수행할 수 있습니다.
Registration is now open for SAS Innovate 2025 , our biggest and most exciting global event of the year! Join us in Orlando, FL, May 6-9.
Sign up by Dec. 31 to get the 2024 rate of just $495.
Register now!