개요
SAS에서 데이터로 작업하려면 데이터가 SAS 데이터셋이라는 특수한 형태여야 합니다. 따라서 SAS 데이터셋을 이해하는 것이 SAS 프로그래밍 학습의 첫 번째 단계입니다.
개념적으로, SAS 데이터셋(또는 테이블이라고 함)은 설명 정보 및 관련 데이터 값을 포함하는 파일입니다. 이 파일은 SAS가 처리할 수 있는 관측치(행) 및 변수(칼럼)의 테이블로 구성됩니다. 어떤 SAS 데이터셋에는 SAS가 데이터의 레코드 위치를 찾을 수 있도록 하는 인덱스도 포함됩니다.
데이터베이스 관리 시스템 파일을 직접 읽기 위해 SAS/ACCESS를 사용할 때와 같이 일부 특수한 경우, SAS 데이터셋에는 데이터 자체가 아니라 데이터에 액세스하기 위한 로직만 포함될 수도 있습니다. 하지만 이 자습서에서는 SAS 데이터셋에 데이터가 포함되는 것으로 가정하겠습니다.
SAS 데이터셋으로 작업하려면 데이터셋이 어떻게 저장되는지 이해해야 합니다. 모든 SAS 파일은 SAS 라이브러리에 저장되는데, 이는 SAS 데이터셋 및 카탈로그와 같은 파일들의 모음입니다. Windows 및 Unix 환경에서 SAS 라이브러리는 일반적으로 같은 폴더나 디렉토리 내의 SAS 파일 그룹입니다.
일부 운영 체제에서는 SAS 라이브러리가 실제적인 파일의 모음입니다. 그 외의 경우에는 파일들이 논리적으로만 연결됩니다.
라이브러리에 액세스하려면 이름(libref, 또는 라이브러리 참조라고도 함)을 지정합니다. SAS 세션 동안 라이브러리를 식별하기 위해 사용하는 별칭이나 바로가기를 라이브러리 이름으로 선택하는 것이 일반적입니다.
이 단원에서는 SAS 라이브러리 할당에 대해 배움으로써 라이브러리의 SAS 데이터셋으로 작업할 수 있도록 합니다.
SAS 라이브러리의 파일 보기
SAS를 시작할 때마다 세 개의 라이브러리가 자동으로 할당됩니다. 이 단원에서는 이들 라이브러리에 대해 배우고 Sashelp 라이브러리의 파일 유형을 알아봅니다.
1. 탐색기 창에서 라이브러리를 더블 클릭합니다 세 개의 라이브러리가 표시되는데 이들은 SAS를 시작할 때마다 자동으로 할당됩니다.
Sashelp
영구 라이브러리로, 샘플 데이터와 기타 파일들을 포함합니다. 읽기 전용 라이브러리입니다.
Sasuser
사용자 개인 설정을 저장하는 Profile 카탈로그의 SAS 파일들을 포함하는 영구 라이브러리입니다. 사용자 자신의 파일을 저장하기에 편리한 장소입니다.
Work
세션이 바뀔 때 저장하지 않아도 되는 파일을 위한 임시 라이브러리입니다.
Sashelp, Sasuser, 그리고 사용자가 직접 할당하는 라이브러리는 영구 라이브러리입니다. 영구 라이브러리의 파일은 운영 체제에 저장됩니다. Work는 임시 라이브러리로, 여기에 포함되는 파일은 SAS 세션을 끝내면 저장되지 않습니다.
2. Sashelp 라이브러리를 더블 클릭합니다.
3. 탐색기 창을 스크롤해 보면 라이브러리에 여러 유형의 파일, 또는 멤버가 있음을 알 수 있습니다. 다음 아이콘들은 가장 일반적인 SAS 파일 유형을 나타낸 것입니다.
라이브러리 할당하기
라이브러리를 정의할 때 SAS 파일의 위치를 SAS로 지정합니다. 라이브러리를 정의하면 라이브러리 내의 SAS 파일을 관리할 수 있습니다. 이 단원에서는 새로운 라이브러리 창을 사용하여 자습서 학습에 사용할 라이브러리를 할당해 보도록 합니다.
1. 도구모음에서 새로운 라이브러리 도구()를 클릭합니다. 새로운 라이브러리 창이 열립니다.
2. 이름에 MyLib을 입력합니다.
라이브러리 이름은
|
3. 시작할 때 자동 할당을 선택합니다. SAS 세션을 시작할 때마다 이 라이브러리가 자동으로 할당됩니다.
4. 찾아보기를 클릭합니다. 기본 위치를 그대로 사용하거나 다른 위치를 선택할 수 있습니다. Mylib 라이브러리에 저장하는 파일은 사용자가 경로에서 지정하는 디렉토리나 폴더에 저장됩니다. 확인을 클릭합니다.
5. 확인을 클릭하여 새로운 라이브러리 창을 닫습니다.
SAS 라이브리러를 삭제할 수도 있습니다. SAS 라이브러리를 삭제하면 SAS 프로그램에서 해당 디렉토리에 액세스할 수 없게 됩니다. 그러나, 라이브러리의 내용은 OS에 그대로 남아 있습니다.
SAS 데이터셋 추가 및 이름 바꾸기
앞서 라이브러리를 만들었으므로 이제 SAS 데이터셋을 라이브러리에 추가할 수 있습니다.
1. 성화된 탐색기 창에서 보기 then 트리 보기를 선택하십시오. 라이브러리가 창 왼쪽 영역에 표시됩니다.
2. Sashelp라이브러리를 클릭합니다.
3. 오른쪽 영역에서 Prdsale 데이터셋을 마우스로 끌어 왼쪽 영역의 Mylib 라이브러리에 가져다 놓습니다.
4. Mylib을 클릭합니다. Prdsale이 여기에 복사된 것을 확인할 수 있습니다.
5. Prdsale를 마우스 오른쪽 버튼으로 클릭하고 이름 바꾸기를 선택합니다. 새로운 이름으로 ProductSales를 입력하고 확인을 클릭합니다.
SAS 데이터셋 이름은
|
SAS 데이터셋 열기
앞에서 데이터셋을 복사하여 이름을 변경해 보았고, 이 페이지에서는 데이터셋에 포함된 데이터를 보겠습니다.
SAS 데이터셋에 데이터를 입력하는 방법은 아주 다양합니다. 일반적으로는 다음 방법을 사용할 수 있습니다.
|
2. VIEWTABLE 창을 스크롤하여 1440개의 행(관측치) 및 10개의 칼럼(변수)을 확인합니다.
일반 데이터 속성 보기
SAS 데이터셋의 디스크립터 부분에는 다음과 같은 데이터셋 정보가 들어 있습니다.
이 정보는 데이터셋의 일반 속성에서 볼 수 있습니다.
1. 색기 창에서 ProductSales 테이블을 마우스 오른쪽 버튼으로 클릭하고 속성을 선택합니다.
2. 일반 탭에서 데이터셋의 속성을 봅니다. (아직 창을 닫지 마십시오. 다음 단계에서도 필요합니다.)
칼럼 속성 보기
디스크립터 부분에는 일반 정보뿐만 아니라 데이터셋의 각 변수에 대한 속성 정보도 들어 있습니다. 속성 정보에는 변수 이름, 유형, 길이, 출력형식, 입력형식, 라벨 등이 포함됩니다.
변수(칼럼) 이름은
SAS에서 변수 이름은 대소문자를 구분하지 않지만 처음 변수가 나타날 때 그 형태를 기억해 두었다가 출력 시 같은 방식으로 표현합니다. |
2. 다음으로 라벨 칼럼을 봅니다. 라벨은 256자 이하의 설명 텍스트입니다. 일부 리포트에서는 VIEWTABLE 창의 칼럼 머리글에 변수 이름 대신 라벨이 사용됩니다.
3. 유형 칼럼을 봅니다. SAS에서 사용되는 변수 유형은 문자와 숫자 두 가지뿐입니다. 문자 변수는 유형 칼럼에 [문자열]로 표시되고 숫자 변수는 [숫자]로 표시됩니다. 길이 속성은 변수 유형과 관련 있습니다.
문자 변수는
|
칼럼 출력형식 변경하기
출력형식은 데이터값이 기록되는 방식에 영향을 주는 변수 속성입니다. SAS는 숫자 및 문자 데이터에 대해 여러 가지 출력형식을 제공합니다. 이 페이지에서는 변수 출력형식을 변경해 봅니다.
1. Mylib.Productsales 속성 창에서 출력형식 칼럼을 봅니다. ACTUAL 변수는 DOLLAR12.2 출력형식을 사용합니다. 이 출력형식은 값 12345를 $12,345.00로 리포트에 나타냅니다.
일반적으로 SAS 출력형식은 다음을 가집니다.
숫자로 된 SAS 출력형식(예: DOLLARw.d)은 표시되는 소수점 이하 자리수인 d 값도 지정할 수 있습니다. |
2. ProductSales 테이블이 아직 열려있지 않으면 엽니다. Actual Sales 칼럼 머리글을 마우스 오른쪽 버튼으로 클릭하고 칼럼 속성을 선택합니다.
3. 칼럼 속성 창에서, 출력형식 옆에 있는 버튼을 클릭합니다.
4. 출력형식 창에서 사용 가능한 출력형식 및 설명을 봅니다. 이 리스트에서 출력형식을 선택하면 출력형식 상세설정 영역에 예제가 표시됩니다.
ACTUAL 변수 값에서 소수점 이하를 빼고 싶으면 [소수점 이하 자리수]를 0으로 변경합니다. 확인을 클릭합니다.
5. 칼럼 속성 창에서 적용을 클릭합니다. 닫기를 클릭합니다.
6. ProductSales 테이블에서 Actual Sales 칼럼의 값에 소수점 이하 자리수가 없음을 확인합니다.
입력형식 이해하기
입력형식은 SAS가 원시 데이터를 읽는 방법을 지정하는 명령입니다. SAS는 읽기 표준 및 비표준 데이터값에 대해 여러 가지 입력형식을 제공합니다.
1. ProductSales 테이블에서 Predicted Sales 칼럼 머리글을 마우스 오른쪽 버튼으로 클릭하고 칼럼 속성을 선택합니다.
2. 칼럼 속성 창에서 PREDICT 칼럼에 12. 입력형식이 사용된다는 것을 확인합니다. 이것은 너비가 12이고 소수점 이하 자리수가 0인 W.D 입력형식입니다. 이 입력형식은 표준 숫자 값을 읽습니다.
3. 입력형식 옆에 있는 버튼을 클릭합니다. 리스트를 스크롤하면 숫자 데이터를 읽을 때 사용할 수 있는 입력형식을 볼 수 있습니다.
입력형식 창에서 취소를 클릭합니다. 칼럼 속성 창에서 닫기를 클릭합니다.
4. ProductSales 테이블에서 Country 칼럼 머리글을 마우스 오른쪽 버튼으로 클릭하고 칼럼 속성을 선택합니다.
5. 칼럼 속성 창에서 입력형식 옆에 있는 버튼을 클릭합니다. 입력형식 창에서 문자 값을 읽기 위한 입력형식이 달러 기호($)로 시작하는 것을 확인합니다. 문자 입력형식 및 설명 리스트를 스크롤하면 사용할 수 있는 입력형식을 볼 수 있습니다.
다음 내용을 기억하십시오.
|
6. 취소를 클릭합니다. 칼럼 속성 창을 닫습니다.
7. VIEWTABLE 창을 닫습니다.
지금까지 ProductSales 데이터셋의 데이터와 디스크립터 부분을 모두 배웠습니다. 다음 페이지에서는 SAS 프로그램 작성하기에 대해 알아보겠습니다.
참고 자료
지금까지 배운 SAS 데이터셋으로 작업하기에 대해 더 알아보려면 아래의 온라인 자료를 참고하십시오.
문서, 참조서, FAQ |
1. SAS에서 도움말 then SAS 도움말과 문서를 클릭합니다.
2. SAS Products then Base SAS then SAS Language Concepts를 선택합니다.
3. SAS File Concepts then SAS Data Libraries를 선택하여 관심 있는 항목을 봅니다.
4. SAS Data Sets를 선택하여 관심 있는 항목을 봅니다.
5. SAS Engines를 선택하여 관심 있는 항목을 봅니다.
샘플 프로그램 |
1. SAS에서 도움말 then SAS 도움말과 문서를 클릭합니다.
2. Learning to Use SAS를 선택하고 Sample SAS Programs를 클릭합니다.
3. Base SAS를 선택하여 관심 있는 항목을 봅니다.
Join us for SAS Innovate 2025, our biggest and most exciting global event of the year, in Orlando, FL, from May 6-9. Sign up by March 14 for just $795.