SAS에서는 변수타입은 2가지 입니다.
Character(문자형): 텍스트나 문자열을 저장할 수 있습니다.
Numeric(숫자형): 숫자값만 저장할 수 있습니다.
data _test1_;
str1 = 'Emma';
str2 = "Hello World!";
str3 = '9';
num1 = 9;
run;
문자형 변수는 '(작은 따옴표) 또는 "(큰 따옴표)와 함께 사용합니다.
str3의 경우 텍스트로 인식하고, num1은 숫자로 인식합니다.
proc contents data=_test1_;
run;
PROC CONTENTS 문으로 _test1_의 데이터셋이 어떠한 변수 타입으로 되어있는지 확인할 수 있습니다.
sales_data로 21개의 칼럼과 2,999개의 데이터로 구성된 데이터가 있습니다.
proc import out = sales_data
datafile= "/home/u45061472/sales_data.xlsx"
dbms=xlsx replace;
getnames=yes;
run;
proc contents data= sales_data; run;
PROC Import: 외부 데이터를 sas 데이터셋으로 불러옵니다.
OUT = sales_data: 불러온 데이터를 sales_data라는 이름으로 sas 데이터셋으로 저장합니다.
datafile = ... : Excel 파일의 경로
DBMS = : 데이터 형식을 지정합니다.
replace: 기존에 sales_Data라는 파일이 있다면 덮어씁니다.
getnames = yes : 데이터셋의 첫번째 행의 변수 이름을 사용합니다.
PROC CONTENTS: 데이터를 이해하기 위해 변수의 목록, 타입, 길이 등의 데이터를 출력합니다.
data test1;
set sales_data;
type = 'default';
run;
data mark_discount;
set test1;
if discount = 0 then type ='without discount';
else type = 'discounted';
run;
TEST1이라는 새로운 데이터셋을 기존의 SALES_DATA 셋을 기반으로 새 데이터셋을 생성합니다.
TYPE이라는 새로운 변수를 만듭니다.
변수의 기본 값을 'default'로 설정합니다.
mark_discount 라는 데이터셋을 만듭니다.
할인(discount) 가 0이면 withdout discount 라는 텍스트로 수정하고, 그 외의 경우에는 discounted(할인 있음)으로 설정합니다.