초보자를 위한 SSIS 튜토리얼:이란 무엇입니까? Archi강의, 패키지

SSIS란 무엇입니까?

SSIS(SQL Server 통합 서비스) 의 구성 요소입니다 Microsoft SQL Server 광범위한 데이터 마이그레이션 작업을 실행하는 데 사용할 수 있는 데이터베이스 소프트웨어입니다. SSIS는 데이터 추출, 로드 및 정리, 집계, 병합 등과 같은 변환에 사용되는 빠르고 유연한 데이터 웨어하우징 도구입니다.

한 데이터베이스에서 다른 데이터베이스로 데이터를 쉽게 이동할 수 있습니다. SSIS는 SQL Server 데이터베이스, Excel 파일, Oracle 및 DB2 데이터베이스 등

SSIS에는 이메일 메시지 전송, FTP 작업, 데이터 소스 및 대상과 같은 워크플로 기능을 수행하기 위한 그래픽 도구 및 마법사도 포함되어 있습니다.

우리가 SSIS를 사용하는 이유는 무엇입니까?

SSIS 도구를 사용하는 주요 이유는 다음과 같습니다.

  • SSIS 도구를 사용하면 다양한 데이터 저장소의 데이터를 병합할 수 있습니다.
  • 관리 기능 및 데이터 로드 자동화
  • 데이터 마트 및 데이터 웨어하우스 채우기
  • 데이터를 정리하고 표준화하는 데 도움이 됩니다.
  • 데이터 변환 프로세스에 BI 구축
  • 관리 기능 및 데이터 로드 자동화
  • SIS에는 사용자가 대규모 프로그램을 작성하는 대신 데이터를 쉽게 변환할 수 있도록 도와주는 GUI가 포함되어 있습니다.
  • 단 몇 분 만에 한 데이터 소스에서 다른 데이터 소스로 수백만 개의 행을 로드할 수 있습니다.
  • 데이터 변경 사항 식별, 캡처, 처리
  • 데이터 유지 관리, 처리 또는 분석 조정
  • SSIS를 사용하면 하드코어 프로그래머가 필요하지 않습니다.
  • SSIS는 강력한 오류 및 이벤트 처리 기능을 제공합니다.

SSIS의 역사

SSIS 이전에는 SQL Server, SQL Server 7 및 2000의 일부인 DTS(Data Transformation Services)가 사용되었습니다.

버전 세부
SQL 서버 2005 이 어플리케이션에는 XNUMXµm 및 XNUMXµm 파장에서 최대 XNUMXW의 평균 출력을 제공하는 Microsoft 팀은 DTS를 개편하기로 결정했습니다. 그러나 DTS를 업데이트하는 대신 제품 이름을 SSIS(Integration Services)로 결정했습니다.
2008 SQL 서버 버전 SSIS의 성능이 많이 향상되었습니다. 새로운 소스도 소개됐다.
SQL 서버 2012 SSIS의 가장 큰 릴리스였습니다. 이 버전에서는 프로젝트 배포 모델이라는 개념이 도입되었습니다. 특정 패키지 대신 전체 프로젝트와 해당 패키지를 서버에 배포할 수 있습니다.
SQL 서버 2014 이 버전에서는 SSIS에 대한 변경 사항이 많지 않습니다. 그러나 코드를 통해 별도의 다운로드를 통해 수행된 새로운 소스 또는 변환이 추가되었습니다.Plex 또는 SQL Server 기능 팩.
SQL Server 2016에서 이 버전을 사용하면 개별 패키지 대신 전체 프로젝트를 배포할 수 있습니다. 추가 소스, 특히 클라우드와 빅 데이터 소스가 있으며 카탈로그에는 거의 변경되지 않았습니다.

SSIS 주요 기능

다음은 몇 가지 중요한 SSIS 기본 기능입니다.

  • 스튜디오 환경
  • 관련 데이터 통합 ​​기능
  • 효과적인 구현 속도
  • 다른 제품과의 긴밀한 통합 Microsoft SQL 제품군
  • 데이터 마이닝 쿼리 변환
  • 퍼지 조회 및 그룹화 변환
  • 용어 추출 및 용어 조회 변환
  • 연결과 같은 고속 데이터 연결 구성 요소 SAP or Oracle

SSIS Archi강의

SSIS Archi강의
SSIS Archi강의

다음은 SSIS 아키텍처의 구성 요소입니다.

  • 제어 흐름(컨테이너 및 작업 저장)
  • 데이터 흐름(소스, 대상, 변환)
  • 이벤트 핸들러(메시지, 이메일 전송)
  • 패키지 탐색기(패키지 내 모든 항목에 대한 단일 보기 제공)
  • 매개변수(사용자 상호작용)

각 구성 요소를 자세히 이해해 보겠습니다.

1. 제어 흐름

제어 흐름은 SSIS 패키지의 두뇌입니다. 모든 구성 요소의 실행 순서를 정렬하는 데 도움이 됩니다. 구성 요소에는 선행 제약 조건에 의해 관리되는 컨테이너와 작업이 포함되어 있습니다.

2. 선행 제약

우선순위 제약은 작업이 미리 정의된 순서로 실행되도록 지시하는 패키지 구성 요소입니다. 또한 전체 SSIS 패키지의 워크플로를 정의합니다. 이는 이전 작업의 결과(특수 표현식을 사용하여 정의된 비즈니스 규칙)를 기반으로 대상 작업을 실행하여 연결된 두 작업의 실행을 제어합니다.

3. 과제

'태스크'는 개별 작업 단위입니다. 프로그래밍 언어에서 사용하는 메소드/함수와 동일합니다. 그러나 SSIS에서는 코딩 방법을 사용하지 않습니다. 대신 드래그 앤 드롭 기술을 사용하여 표면을 디자인하고 구성합니다.

4. 컨테이너

컨테이너는 작업을 작업 단위로 그룹화하는 단위입니다. 시각적 일관성을 제공하는 것 외에도 특정 컨테이너의 범위에 있어야 하는 변수 및 이벤트 핸들러를 선언할 수도 있습니다.

SSIS의 네 가지 유형의 컨테이너는 다음과 같습니다.

  • 시퀀스 컨테이너
  • For 루프 컨테이너
  • Foreach 루프 컨테이너

시퀀스 컨테이너: 보조 작업을 그룹화하여 구성할 수 있으며 트랜잭션을 적용하거나 컨테이너에 로깅을 할당할 수 있습니다.

For 루프 컨테이너:작업을 여러 번 실행할 수 있다는 점을 제외하면 시퀀스 컨테이너와 동일한 기능을 제공합니다. 그러나 이는 1에서 100까지 반복되는 것과 같은 평가 조건을 기반으로 합니다.

각 루프 컨테이너에 대해 다음을 수행합니다. 또한 루핑도 허용합니다. 그러나 조건 표현식을 사용하는 대신 개체 집합에 대해 루프가 수행된다는 차이점은 폴더의 파일을 좋아합니다.

5. 데이터 흐름

SSIS 도구의 주요 용도는 데이터를 서버 메모리로 추출하고 변환한 후 다른 대상에 쓰는 것입니다. 제어 흐름이 두뇌라면 데이터 흐름은 SSIS의 핵심입니다.

6. SSIS 패키지

SSIS의 또 다른 핵심 구성 요소는 패키지 개념입니다. 이는 순서대로 실행되는 작업의 모음입니다. 여기서, President 제약 조건은 작업이 실행되는 순서를 관리하는 데 도움이 됩니다.

패키지는 파일을 다음 위치에 저장하는 데 도움이 될 수 있습니다. SQL 서버, msdb 또는 패키지 카탈로그 데이터베이스에 있습니다. Reporting Services의 .rdl 파일과 매우 유사한 구조화된 파일인 .dtsx 파일로 저장할 수 있습니다.

SSIS 패키지

7. 매개 변수

매개변수는 변수와 매우 유사하게 동작하지만 몇 가지 주요 예외가 있습니다. 패키지 외부에 쉽게 설정할 수 있습니다. 패키지를 시작하기 위해 전달해야 하는 값으로 지정할 수 있습니다.

SSIS 작업 유형

SSIS 도구에서는 흐름을 제어하는 ​​작업을 추가할 수 있습니다. 다양한 종류의 작업을 수행하는 다양한 유형의 작업이 있습니다.

몇 가지 중요한 SSIS 작업이 아래에 언급되어 있습니다.

작업 이름 Descript이온
SQL 작업 실행 이름에서 알 수 있듯이 관계형 데이터베이스에 대해 SQL 문을 실행합니다.
데이터 흐름 작업 이 작업은 하나 이상의 소스에서 데이터를 읽을 수 있습니다. 데이터가 메모리에 있을 때 데이터를 변환하고 하나 이상의 대상에 기록합니다.
Analysis Services 처리 작업 이 작업을 사용하면 테이블 형식 모델의 개체를 처리하거나 SSAS 큐브로 처리할 수 있습니다.
패키지 작업 실행 이 SSIS 작업을 사용하여 동일한 프로젝트 내에서 다른 패키지를 실행할 수 있습니다.
프로세스 작업 실행 이 작업을 통해 명령줄 매개변수를 지정할 수 있습니다.
파일 시스템 작업 파일 시스템에서 조작을 수행합니다. 파일 이동, 이름 바꾸기, 삭제, 디렉토리 생성과 같습니다.
FTP 작업 기본 FTP 기능을 수행할 수 있습니다.
스크립트 작업 이것은 빈 작업입니다. 모든 작업을 수행하는 NET 코드를 작성할 수 있습니다. 당신은 공연하고 싶어합니다.
전송 Mail 태스크 패키지가 완료되었거나 오류가 발생했음을 사용자에게 알리는 이메일을 보낼 수 있습니다.
대량 삽입 작업 대량 삽입 명령을 사용하여 테이블에 데이터를 로드할 수 있습니다.
스크립트 작업 세트를 실행합니다. VB.NET 또는 Visual Studio 환경 내에서 C# 코딩.
웹 서비스 작업 웹 서비스에서 메소드를 실행합니다.
WMI 이벤트 감시자 작업 이 작업을 통해 SSIS 패키지는 특정 WMI 이벤트를 기다리고 응답할 수 있습니다.
XML 작업 이 작업은 XML 파일을 병합, 분할 또는 다시 포맷하는 데 도움이 됩니다.

기타 중요한 ETL 도구

  • SAP 데이터 서비스
  • SAS 데이터 관리
  • Oracle 창고 빌더(OWB)
  • 파워센터 인포매티카
  • IBM Infosphere 정보 서버
  • 데이터 ETL을 위한 Elixir 레퍼토리
  • Sargent 데이터 흐름

SSIS 사용의 장점과 단점

SSIS 도구는 다음과 같은 이점을 제공합니다.

  • 광범위한 문서 및 지원
  • 구현의 용이성과 속도
  • SQL Server 및 비주얼 스튜디오
  • 표준화된 데이터 통합
  • 실시간 메시지 기반 기능 제공
  • 유통모델 지원
  • SSIS가 SQL에 데이터를 삽입할 때 병목 현상이 발생하는 네트워크를 제거하는 데 도움이 됩니다.
  • SISS를 사용하면 OLE DB 대신 SQL Server 대상을 사용하여 데이터를 더 빠르게 로드할 수 있습니다.

SSIS의 단점

SSIS 도구 사용의 몇 가지 단점은 다음과 같습니다.

  • 때때로 Windows가 아닌 환경에서 문제가 발생합니다.
  • 불투명한 비전과 전략
  • SSIS는 대체 데이터 통합 ​​스타일에 대한 지원이 부족합니다.
  • 다른 제품과의 통합 문제

SSIS 최고의 사례 예

  • SSIS는 메모리 내 파이프라인입니다. 그렇기 때문에 모든 변환이 메모리에서 발생하는지 확인하는 것이 중요합니다.
  • 기록된 작업을 최소화하세요
  • 리소스 활용도를 파악하여 용량 계획
  • SQL 조회 변환, 데이터 원본 및 대상 최적화
  • 일정을 계획하고 올바르게 배포하세요.

요약

  • SSIS의 전체 형태는 SQL Server Integration Services입니다.
  • SSIS 도구를 사용하면 다양한 데이터 저장소의 데이터를 병합할 수 있습니다.
  • SQL Server Integration Service의 중요한 버전은 2005, 2008, 2012, 2014 및 216입니다.
  • Studio 환경, 관련 데이터 통합 ​​기능 및 효과적인 구현 속도는 SSIS의 중요한 기능입니다.
  • 제어 흐름, 데이터 흐름, 이벤트 핸들러, 패키지 탐색기 및 매개변수는 필수적인 SSIS 아키텍처 구성 요소입니다.
  • SQL 작업 실행, 데이터 흐름 작업, Analysis Services 처리 작업, 패키지 실행 작업, 프로세스 실행 작업, 파일 시스템 작업, FTP 작업, 보내기 Mail 작업, 웹 서비스 작업이 중요합니다.
  • 광범위한 문서 및 지원
  • SSIS의 가장 큰 단점은 대체 데이터 통합 ​​스타일에 대한 지원이 부족하다는 것입니다.
  • SAP 데이터 서비스, SAS 데이터 관리, Oracle OWB(웨어하우스 빌더), PowerCenter Informatica, IBM Infosphere 정보 서버
  • SSIS는 메모리 내 파이프라인입니다. 따라서 모든 변환이 메모리에서 발생하는지 확인하는 것이 중요합니다.