초보자를 위한 SAS 튜토리얼: 정의 및 프로그래밍 예제

SAS란 무엇입니까?

SAS 통계 데이터 분석 및 시각화에 널리 사용되는 명령 기반 통계 소프트웨어 제품군입니다. SAS 전체 형식은 통계 분석 소프트웨어입니다. 이를 통해 직원 생산성과 비즈니스 이익을 향상시키는 데 도움이 되는 질적 기술과 프로세스를 사용할 수 있습니다. SAS는 비즈니스 인텔리전스, 범죄 조사, 예측 분석과 같은 고급 분석에도 사용됩니다. SAS는 "SaaS"로 발음됩니다.

SAS에서는 데이터가 추출되고 분류되어 데이터 패턴을 식별하고 분석하는 데 도움이 됩니다. 이는 고급 분석, 비즈니스 인텔리전스, 예측 분석, 데이터 관리를 수행하여 경쟁적이고 변화하는 비즈니스 환경에서 효과적으로 운영할 수 있는 소프트웨어 제품군입니다. 더욱이 SAS는 플랫폼 독립적이므로 Linux 또는 Windows.

다른 것에 비해 BI 도구, SAS는 드래그 앤 드롭 인터페이스를 사용하는 것 외에도 프로그래밍 방식으로 데이터를 변환하고 분석하기 위한 광범위한 지원을 제공합니다. 이는 USP인 데이터 조작 및 분석에 대한 매우 세부적인 제어를 제공합니다.

SAS가 왜 필요한가요?

간단한 예를 통해 SAS의 필요성을 이해해 보겠습니다.

과거 데이터를 기반으로 고객의 구매 패턴을 알고 싶어하는 전자 상거래 회사를 생각해 보십시오. 회사는 일반화된 통찰력을 얻기 위해 여러 고객의 수천 건의 기록을 고려해야 합니다.

회사는 분석에 필요한 이러한 데이터를 모두 가지고 있지 않을 수도 있습니다. 예를 들어 고객이 재킷을 구매하지 않은 경우 재킷을 구매하지 못하게 된 요인은 무엇입니까? 이 누락된 데이터는 분석에 오류를 일으킬 수 있습니다. 이러한 문제를 어떻게 없앨 수 있습니까? 이런 유형의 데이터를 어떻게 처리할 수 있나요?

수동으로 수행하면 이 작업에는 수백 명의 분석가와 수천 시간의 인력이 필요합니다. SAS 분석 도구를 사용하면 단 한 명의 분석가로 몇 시간 만에 동일한 분석을 수행할 수 있습니다. SAS 도구를 사용하면 불필요한 데이터를 제거하고 관련 정보를 최적화할 수 있습니다. 누락된 데이터가 있어도 결과를 예측할 수 있습니다. SAS를 사용하면 더 나은 결정을 내릴 수 있습니다.

대체 SAS 도구

대체 SAS 도구

R: 오픈소스 소프트웨어입니다. R은 잘 문서화되어 있어 배우기 쉽습니다. 강력한 통계 기능을 제공합니다.

Python 또 다른 인기 있는 오픈소스 스크립팅 언어입니다. Numpy, Scipy, MatPlotLib와 같은 라이브러리를 지원합니다. 모든 통계적 작업을 수행하거나 이러한 라이브러리를 사용하여 모든 모델을 빌드할 수 있습니다.

SAS : 상업용 분석 시장에서 널리 사용되는 분석 도구입니다. 다양한 통계 기능과 좋은 GUI를 갖추고 있습니다.

이 SAS 프로그래밍 튜토리얼에서는 통계 분석 시스템에 대해 설명하고 이를 사용하여 문제를 해결하는 방법에 대해 설명합니다.

SAS 역사

  • SAS는 1970년 NC 대학의 Jim Goodnight와 John Shall에 의해 개발되었습니다.
  • 처음에는 농업 연구용으로 개발되었습니다.
  • Later, 예측 분석, 데이터 관리, BI를 포함하는 다양한 도구로 확장되었습니다.
  • 현재 Fortune 98대 기업 중 400개 기업이 SAS 데이터 분석 도구를 사용하고 있습니다. 데이터 분석.

다음으로 SAS 언어 튜토리얼에서는 SAS의 기능에 대해 알아봅니다.

SAS 기능

SAS의 주요 기능은 다음과 같습니다.

  • 외부 데이터베이스의 원시 데이터 파일 및 데이터에 쉽게 액세스할 수 있습니다. 거의 모든 데이터 형식을 읽고 쓰세요!
  • 데이터 입력, 편집 검색, 서식 지정 및 변환 도구를 사용하여 데이터 관리
  • 기술, 통계, 다변량 기법, 예측, 모델링, 선형 프로그래밍을 사용하여 데이터를 분석합니다.
  • 고급 분석은 비즈니스 관행을 변경하고 개선하는 데 도움이 됩니다.
  • 완벽한 그래프로 보고서 구성
  • Opera연구 및 프로젝트 관리
  • 데이터 업데이트 및 수정
  • 강력한 데이터 처리 언어
  • 뛰어난 데이터 정리 기능
  • 여러 호스트 시스템과 상호 작용

다음으로 초보자를 위한 SAS 튜토리얼에서는 SAS 제품군에 대해 알아봅니다.

SAS 제품군

시중에는 많은 SAS 제품이 있습니다. 다음은 더 인기 있는 제품 목록입니다.

성함 상품 설명
기본 SAS Base SAS 소프트웨어는 하드웨어 민첩성을 제공하고 모든 종류의 컴퓨팅 환경에 통합됩니다.
SAS/그래프 이 도구는 구조화된 데이터를 그래프로 표현하는 데 도움이 됩니다.
SAS/통계 이 도구는 다양한 유형의 회귀, 통계 분석 분산, 회귀 및 심리 측정 분석을 수행하는 데 도움이 됩니다.
SAS/ETS 예측하는 데 사용됩니다. 시계열 분석을 수행하는 데 도움이 됩니다.
SAS/IML 대화형 Matric 언어는 IML로 알려져 있습니다. 이 도구는 수학 공식을 혁신적인 프로그램으로 변환하는 데 도움이 됩니다.
SAS EBI 비즈니스 인텔리전스 애플리케이션을 위한 도구
SAS 그리드 관리자 데이터 관리 기능과 데이터 분석을 위한 프로그래밍 언어를 제공하는 핵심 구성 요소입니다.
SAS/또는 도구 Opera연구
SAS/QC 품질 관리에 사용
SAS/엔터프라이즈 마이너 데이터 수집
SAS/PH 임상시험 분석
SAS/AF 그것은 응용 프로그램 시설을 제공합니다
기업 가이드 GUI 기반 코드 편집기이자 프로젝트 관리자입니다.

SAS 튜토리얼 가이드의 다음 부분에서는 SAS 아키텍처에 대해 알아보겠습니다.

SAS Archi강의

SAS Archi강의
ArchiSAS의 강의

SAS 아키텍처는 주로 세 부분으로 나뉩니다.

  • 클라이언트 계층
  • 중간 계층
  • 뒷층

클라이언트 계층

클라이언트 계층은 사용자가 있는 컴퓨터에 애플리케이션이 설치되는 곳입니다. 포털과 해당 콘텐츠를 보는 데 사용되는 구성 요소로 구성됩니다. 또한 표준 HTTP 또는 HTTPS 프로토콜을 통해 포털과 상호 작용하는 데 사용되는 표준 웹 브라우저도 포함되어 있습니다. 또한 SAS 웹 응용 프로그램 방화벽을 친화적으로 만드는 데 도움이 됩니다.

중간 계층

중간 계층은 엔터프라이즈 정보에 대한 중앙 집중식 액세스 지점을 제공합니다. 콘텐츠에 대한 모든 액세스는 이 계층에서 작동하는 구성 요소에 의해 처리됩니다. 비즈니스 로직과 디스플레이 로직을 분리하면 중간 계층의 로직을 활용하는 데 도움이 됩니다. 또한 중앙 집중식 액세스 지점을 통해 보안 규칙을 시행하고 포털을 관리하고 코드 변경을 관리하는 것이 더 쉬워집니다.

중간 계층은 다음과 같은 기능을 담당합니다.

SAS Information Delivery Portal 웹 애플리케이션: JSP의 모음입니다. Java 서블릿, JavaBean, 기타 클래스 및 리소스. 이러한 구성 요소는 엔터프라이즈 디렉터리에 저장된 정보에 액세스하여 사용자를 위한 사용자 정의 가능한 인터페이스를 만드는 데 도움이 됩니다.

서블릿 엔진: 서블릿 엔진은 서블릿 컨테이너라고도 합니다. SAS Information Delivery Portal 웹 애플리케이션 관리를 담당합니다. 서블릿 엔진은 런타임 환경을 제공합니다. 동시성, 배포, 수명주기 관리 등을 제공합니다.

웹 서버: 웹 서버는 웹 사이트를 호스팅하는 데 사용할 수 있는 서블릿 엔진에 대한 서비스를 제공합니다. 포털을 사용하여 액세스해야 합니다.

백티어

백 티어는 비즈니스 객체를 포함할 수 있는 데이터 및 계산 서버가 실행되는 영역입니다. 기업용 디렉토리 서버입니다. 기업 디렉토리 서버는 기업 전체에 있는 콘텐츠에 대한 메타데이터를 유지 관리합니다.

SAS 다운로드 및 설치 방법

컴퓨터에서 로컬 다운로드

1단계) 해당 링크에서 SAS를 다운로드합니다.

이 링크로 이동 https://www.sas.com/en_in/software/university-edition.html 그리고 무료 소프트웨어 받기를 클릭하세요.

SAS 다운로드 및 설치

2단계) 선택하세요. Opera팅 시스템

귀하의 시스템에 맞는 운영 체제를 선택하세요.

SAS 다운로드 및 설치

3단계) ​​가상화 소프트웨어 다운로드 및 설치

SAS에는 다음과 같은 가상화 소프트웨어가 필요합니다. VirtualBox 설치하기 전에 설치해야 합니다. 자세한 단계는 다음과 같습니다.

SAS 다운로드 및 설치

SAS를 설치하려면 화면에 언급된 단계를 따르십시오. 데 VirtualBox 로컬 설치는 때때로 까다로울 수 있습니다. AWS 설치를 권장합니다.

AWS 설치

AWS에 SAS를 배포할 수 있습니다. 무료 등급을 받을 수 있습니다.

단계 1) We Buy Orders 신청서를 클릭하세요. https://aws.amazon.com/marketplace/pp/B00WH10IKW. “구독 계속”을 클릭하세요.

SAS 다운로드 및 설치

단계 2) 다음 화면에서는 약관에 동의하세요.

SAS 다운로드 및 설치

단계 3) 구독이 보류 중이며 승인하는 데 최대 10분이 걸립니다. 다음 화면이 표시됩니다.

SAS 다운로드 및 설치

단계 4) 페이지를 새로 고치면 구독이 확인됩니다. 구성 계속을 클릭하세요.

SAS 다운로드 및 설치

단계 5) 설정을 기본값으로 유지하고 계속 실행을 클릭합니다.

SAS 다운로드 및 설치

단계 6) Rev구성 페이지를 보시죠. 키-값 쌍을 입력하세요. 나머지 설정은 기본값이어야 합니다. 실행을 클릭하세요

SAS 다운로드 및 설치

단계 7) We Buy Orders 신청서를 클릭하세요. https://aws.amazon.com/marketplace/library/ 그리고 인스턴스 보기를 클릭하세요.

SAS 다운로드 및 설치

단계 8) 팝업에서

  1. 인스턴스 ID를 기록해 두십시오. 이것이 당신의 비밀번호입니다
  2. 소프트웨어 액세스를 클릭하세요.

SAS 다운로드 및 설치

단계 9) 8단계에서 클릭하면 나타나는 팝업에서

  1. 사용자 자격 증명을 입력합니다. ID: sasdemo 비밀번호: 8단계에서 기록한 인스턴스 ID
  2. 로그인 클릭

SAS 다운로드 및 설치

단계 10) 환영 화면이 나타납니다.

SAS 다운로드 및 설치

문제해결

접속이 안되면 다음으로 가세요 https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId 및 모든 인바운드/아웃바운드 규칙

SAS를 사용하는 방법?

SAS 소프트웨어를 효과적으로 사용하려면 데이터 액세스, 데이터 관리, 분석, 제시의 네 단계를 따라야 합니다.

SAS를 사용하는 방법
SAS를 사용하는 방법

데이터 액세스:

SAS를 사용하면 원하는 형식의 데이터에 액세스할 수 있습니다.

시스템의 파일이든 다른 데이터베이스 시스템에 저장된 데이터이든 어디에나 저장된 데이터에 액세스할 수 있습니다. Oracle 파일, SAS 데이터베이스 파일, Raw Database 파일 또는 간단한 XLS/CSV 파일이 될 수 있습니다. 이 기능을 사용하면 이 데이터에 쉽게 액세스할 수 있습니다.

데이터 관리:

SAS는 뛰어난 데이터 관리 기능을 제공합니다. 특정 조건을 기반으로 데이터를 하위 집합/조각화하고, 변수를 생성하고, 데이터를 정리하고 검증할 수 있습니다. 동일한 작업을 수행할 수 있는 다른 도구도 있습니다. 그러나 SAS는 이러한 작업을 쉽게 수행할 수 있도록 도와줍니다.

SAS는 잘 정의된 라이브러리와 프로세스를 가지고 있어 프로그래밍 프로세스가 쉽습니다. 게다가 변수나 하위 집합 데이터를 만드는 것은 단 한 단계의 프로세스입니다. 이를 통해 단 한 줄의 코드로 복잡한 알고리즘을 작성할 필요가 없습니다.

분석 :

SAS를 사용하여 다양한 종류의 분석을 수행할 수 있습니다.

  • 평균 계산 빈도를 확인합니다.
  • 회귀 및 예측
  • 의사 결정 트리

이러한 모든 분석은 SAS를 통해 쉽게 처리할 수 있습니다. 정확한 예측을 위한 최고의 도구입니다.

현재 :

데이터를 올바르게 시각화하면 청중이 쉽게 공감할 수 있습니다. 도구가 데이터를 적절한 방식으로 표시하는 것이 중요합니다. 이것이 바로 SAS가 여러분을 위해 하는 일입니다. 뛰어난 프리젠테이션 능력을 갖고 있습니다.

당신은 할 수 :

1. 목록 보고서

2. 요약 보고서

3. 그래프 보고서

4. 보고서 인쇄

SAS 프로그램 예

SAS 프로그램은 세 가지 필수 단계로 구성됩니다.

  • 데이터 단계
  • 프로세스 단계
  • 출력 단계

데이터 단계

데이터 단계는 필요한 데이터 세트를 SAS 메모리에 로드하고 데이터 세트의 올바른 변수를 찾습니다. 기록도 포착합니다. 데이터 단계를 사용하여 다음을 수행할 수 있습니다.

  • SAS 데이터 세트에 데이터 입력
  • 값 계산
  • 데이터 확인 또는 수정
  • 새로운 데이터 세트 생성

DATA 문의 구문은 다음과 같습니다.

통사론

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

예:

다음 예는 변수를 정의하고, 데이터 집합에 이름을 지정하고, 새 변수를 만들고, 데이터를 입력하는 방법을 보여줍니다. 이 예에서 문자열 변수는 끝에 $가 있고, 숫자 값은 없는 것을 볼 수 있습니다.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

참고: SAS 문을 실행하려면 RUN 명령을 지정해야 합니다.

PROC 단계

특정 분석이나 기능을 수행하여 결과와 보고서를 생성합니다.

통사론

PROC procedure_name options; #The name of the proc.
RUN;

예시

주어진 예에서는 다음을 사용합니다. 방법 데이터 세트에 있는 숫자 변수의 평균값을 인쇄하는 절차입니다.

PROC MEANS;
RUN;

출력 단계

조건부 출력 문을 사용하여 데이터의 데이터를 표시할 수 있습니다.

통사론

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

모든 SAS 프로그램은 위에서 언급한 모든 단계를 따라 입력 데이터를 읽고, 데이터를 분석하고, 분석 결과를 제공해야 합니다. 그만큼 운영 각 단계 끝에 있는 명령문은 해당 단계의 실행을 완료합니다.

완전한 SAS 프로그램

아래에는 위의 각 단계에 대한 전체 코드가 나와 있습니다.

완전한 SAS 프로그램

출력:

완전한 SAS 프로그램

완전한 SAS 프로그램

완전한 SAS 프로그램

SAS는 어디에 사용되나요?

아래에는 몇 가지 중요한 SAS 애플리케이션이 나와 있습니다.

업종 용법
제약 통계 분석, 보고
통신 ETL, 보고, 데이터 마이닝, 예측
재무 ETL, 보고, 데이터 마이닝, 금융 연구
예측 모델링 DB마케팅, 활동기반관리
의료 ETL, 보고, 데이터 마이닝

SAS 대. 아르 자형

SAS R
SAS는 상용 소프트웨어이므로 재정적 투자가 필요합니다. R 오픈 소스 소프트웨어입니다. 그러므로 누구나 사용할 수 있습니다.
SAS는 배우기 가장 쉬운 분석 도구입니다. SQL에 대한 지식이 부족한 사람이라도 빠르게 배울 수 있습니다. R에서는 복잡하고 긴 코드를 작성해야 합니다.
SAS는 대기업에서 매우 선호하는 선택이며 기술적으로 상당히 진보되고 사용자 친화적입니다. R은 빠르게 발전하는 소프트웨어입니다. 그러나 계속 업그레이드해야 합니다.
SAS는 우수한 그래픽 지원을 제공하지만 사용자 정의 기능을 제공하지 않습니다. R 도구의 그래픽 지원은 매우 열악합니다.

SAS의 장점

  • SAS는 프로그래밍 지식 없이도 배울 수 있는 쉬운 구문을 가지고 있습니다.
  • 대용량 데이터베이스를 쉽게 처리하는 능력
  • SAS는 쉽게 디버깅할 수 있는 매우 이해하기 쉬운 언어입니다.
  • "로그" 창에는 오류가 명확하게 표시되어 코드를 쉽게 디버그하는 데 도움이 됩니다.
  • SAS는 알고리즘을 철저하게 테스트하고 분석하도록 도와줍니다.
  • SAS는 완벽하게 보안되어 있어 사무실에서 라이센스 없이는 추출이 불가능합니다.
  • 프로그래밍을 하지 않는 사용자도 쉽게 통계 계산을 수행할 수 있습니다.
  • 대용량 데이터베이스를 효과적으로 처리합니다.

SAS의 단점

  • 개인이나 조직이 적절한 라이센스 없이는 모든 애플리케이션을 사용할 수 없기 때문에 비용이 높습니다.
  • SAS는 오픈소스가 아니므로 SAS에서 사용하는 알고리즘을 일반적으로 사용할 수 없습니다.
  • SAS에서 텍스트 마이닝은 매우 번거롭고 어려운 프로세스입니다.

요약

  • SAS 소프트웨어는 데이터 분석에 사용되는 통계 분석 소프트웨어를 의미합니다.
  • R과 Python SAS의 널리 사용되는 두 가지 대체 도구입니다.
  • SAS는 1970년 NC 대학의 Jim Goodnight와 John Shall에 의해 개발되었습니다.
  • SAS를 사용하면 모든 종류의 외부 데이터베이스에 있는 원시 데이터 파일 및 데이터에 액세스할 수 있습니다.
  • SAS 아키텍처는 주로 1가지 부분으로 나뉩니다. 2) 클라이언트 계층 3) 중간 계층 XNUMX) 백 계층
  • SAS 소프트웨어를 사용하려면 1) 데이터 액세스, 2) 관리 3) 데이터 분석, 4) 프레젠테이션의 네 단계를 수행해야 합니다.
  • SAS 프로그램은 Data Step, Proc Step, Output Step의 세 가지 기본 단계로 구성됩니다.
  • SAS 데이터 분석 도구 제약, 통신, 금융, 예측 모델링, 의료 등의 분야에서 널리 사용됩니다.
  • SAS는 상용 소프트웨어이고 R은 오픈 소스 소프트웨어입니다.
  • SAS 프로그래머 도구의 가장 큰 장점은 프로그래밍 지식이 없어도 쉽게 배울 수 있는 구문을 가지고 있다는 것입니다.
  • SAS 모델의 단점 중 하나는 오픈 소스 도구가 아니라는 것입니다. 따라서 SAS 절차에서 사용되는 알고리즘은 일반적으로 사용할 수 없습니다.