BookmarkSubscribeRSS Feed

[HTML] HTML TAG 사이의 데이터 추출

Started ‎06-14-2020 by
Modified ‎06-14-2020 by
Views 168

* _INFILE_ 이라는 내부 변수를 생성 후에 해당 tag의 위치를 검색하여서 문다를 추출.

* 한글 처리를 위하여 NLS(다국어 지원) 함수를 사용;

* NLS함수는 기존 함수 앞에 K문자가 추가됨.;

 

* 전체 HTML에서 해당 위치를 찾는 별도 로직 필요 - 아래 참조 페이지;

 

DATA BACK;

*  INFILE DATALINES ENCODING="UTF-8";

INFILE DATALINES;

 INPUT;

 LENGTH VAR $100;

 

 * KSUBSTR(_INFILE_ 내부 변수, <trtCntn> TAG 끝 위치, <trtCntn> tag와 </trtCntn> tag 사이의 길이);

 var = KSUBSTR(_INFILE_,KINDEX(_INFILE_,'<trtCntn>')+9,KINDEX(_INFILE_,'</trtCntn>')-KINDEX(_INFILE_,'<trtCntn>')-9);

DATALINES;

 

<trtCntn> 통계 분석 연구회 </trtCntn>

<trtCntn> http://cafe.daum.net/statsas </trtCntn>

<trtCntn> https://www.facebook.com/groups/statsas </trtCntn>

통계분석연구회 <trtCntn> http://cafe.daum.net/statsas </trtCntn> 통계분석연구회

통계분석연구회 <trtCntn> http://cafe.daum.net/statsas </trtCntn>통계분석연구회

;

 

 

[정규식] 정규식 (PERL 함수) 을 사용하여서 웹사이트(web site) URL 주소 검색

  : http://cafe.daum.net/statsas/3F8j/306

 

[HTML] HTML 상의 데이터를 처리하여서 SAS 데이터로 읽기(COMPRESS 와 정규식 함수)

  : http://cafe.daum.net/statsas/3F8j/213

 

* 참조 : 

  FILENAME URL

  PROC HTTP 프로시져

Version history
Last update:
‎06-14-2020 10:42 PM
Updated by:
Contributors

hackathon24-white-horiz.png

The 2025 SAS Hackathon Kicks Off on June 11!

Watch the live Hackathon Kickoff to get all the essential information about the SAS Hackathon—including how to join, how to participate, and expert tips for success.

YouTube LinkedIn

Article Labels
Article Tags