Informatica PowerCenter 자습서: Archi강의, 부품

인포매티카 파워센터 Archi강의

Informatica PowerCenter의 전체 아키텍처는 서비스 지향적입니다. Architecture(SOA). Informatica ETL 도구 아키텍처는 다음 서비스 및 구성 요소로 구성됩니다.

  1. 리포지토리 서비스 – Informatica 메타데이터를 유지 관리하고 다른 서비스에 대한 액세스를 제공하는 일을 담당합니다.
  2. 통합 서비스 – 소스에서 타겟으로 데이터 이동을 담당합니다.
  3. 보고 서비스 – 보고서 생성 가능
  4. 노드 – 위의 서비스가 실행되는 컴퓨팅 플랫폼
  5. 인포매티카 디자이너 – 소스와 대상 간의 매핑 생성에 사용됩니다.
  6. 워크플로우 관리자 – 워크플로, 기타 작업 및 실행을 생성하는 데 사용됩니다.
  7. 워크플로우 모니터 – 워크플로 실행을 모니터링하는 데 사용됩니다.
  8. 리포지토리 관리자 – 저장소의 개체를 관리하는 데 사용됩니다.
정보학 Archi강의 다이어그램
정보학 Archi강의 다이어그램

인포매티카 도메인

Informatica 도메인은 Informatica 도구의 기본 관리 단위입니다. 이는 노드와 서비스의 모음입니다. 또한 이 노드와 서비스는 관리 요구 사항에 따라 폴더와 하위 폴더로 분류될 수 있습니다.

예를 들어 아래 스크린샷에서는 도메인 창 아래에 노드 이름 "node01_rajesh"와 서비스를 "guru99 통합 서비스"로 만든 "Domain_Rajesh" 폴더가 생성된 것을 볼 수 있습니다.

Informatica의 도메인
Informatica의 도메인

노드는 도메인 내부의 머신을 논리적으로 표현한 것입니다. Informatica에 대한 서비스 및 프로세스를 실행하려면 노드가 필요합니다.

도메인에는 여러 노드가 있을 수 있습니다. 도메인에서는 게이트웨이 노드도 찾을 수 있습니다.

게이트웨이 노드는 다양한 클라이언트 도구로부터 요청을 수신하고 해당 요청을 다양한 노드 및 서비스로 라우팅하는 역할을 합니다.

도메인에는 두 가지 유형의 서비스가 있습니다.

  • 서비스 관리자: 서비스 관리자는 인증, 권한 부여, 로깅과 같은 도메인 작업을 관리합니다. 또한 노드에서 애플리케이션 서비스를 실행하고 사용자와 그룹을 관리합니다.
  • 응용 프로그램 서비스: 애플리케이션 서비스는 통합 서비스, 리포지토리 서비스, 리포팅 서비스 등 서버별 서비스를 나타냅니다. 이러한 서비스는 구성에 따라 다른 노드에서 실행됩니다.

Informatica PowerCenter 리포지토리

PowerCenter 리포지토리는 다음과 같은 관계형 데이터베이스입니다. Oracle, 사이베이스, SQL 서버이며 저장소 서비스에 의해 관리됩니다. 메타데이터를 저장하는 데이터베이스 테이블로 구성됩니다.

Informatica PowerCenter에서는 세 가지 Informatica 클라이언트 도구를 사용할 수 있습니다. 그들은 인포매티카입니다

  • 디자이너
  • 워크플로우 모니터
  • 워크플로우 관리자

이러한 클라이언트는 저장소 서비스만 사용하여 저장소에 액세스할 수 있습니다.

리포지토리를 관리하기 위해 Repository Service라는 Informatica 서비스가 있습니다. 단일 저장소 서비스는 하나의 저장소만 독점적으로 처리합니다. 또한 리포지토리 서비스는 여러 노드에서 실행되어 성능을 높일 수 있습니다.

리포지토리 서비스는 개체에 잠금을 사용하므로 여러 사용자가 동일한 개체를 동시에 수정할 수 없습니다.

저장소에서 버전 제어를 활성화할 수 있습니다. 버전 제어 기능을 사용하면 동일한 객체의 다양한 버전을 유지할 수 있습니다.

저장소에 생성된 객체는 다음의 세 가지 상태를 가질 수 있습니다.

  • 유효한: 유효한 개체는 Informatica에 따라 구문이 올바른 개체입니다. 이러한 개체는 워크플로 실행에 사용될 수 있습니다.
  • 잘못된: 유효하지 않은 개체는 지정된 표준이나 규칙을 준수하지 않는 개체입니다. Informatica에 개체가 저장되면 해당 구문과 속성이 유효한지 여부가 확인되고 그에 따라 개체 상태가 표시됩니다.
  • 영향을: 영향을 받는 개체는 하위 개체가 유효하지 않은 개체입니다. 예를 들어 매핑에서 재사용 가능한 변환을 사용하고 이 변환 개체가 유효하지 않게 되면 매핑이 영향을 받은 것으로 표시됩니다.

Informatica의 도메인 구성

앞서 언급했듯이 도메인은 Informatica의 기본 관리 제어입니다. 통합 서비스, 리포지토리 서비스 및 다양한 노드와 같은 다른 서비스로 구성된 상위 엔터티입니다.

도메인 구성은 Informatica 관리 콘솔을 사용하여 수행할 수 있습니다. 콘솔은 웹 브라우저를 사용하여 시작할 수 있습니다.

Informatica의 도메인 구성

웹 브라우저에서 열면 관리자 로그인을 묻는 메시지가 나타납니다. 암호는 Informatica 설치 중에 설정됩니다.

Informatica의 도메인 구성

Informatica 도메인에 로그인하면 홈 페이지가 다음과 같이 표시됩니다.

Informatica의 도메인 구성

왼쪽 창에는 도메인 아래의 기존 노드, 저장소 서비스, 통합 서비스가 표시됩니다.

기본 창에는 해당 서비스의 상태가 작동 중인지 작동 중지되었는지 표시됩니다.

Informatica의 도메인 속성

관리 페이지의 속성 메뉴를 클릭하면 도메인의 속성을 볼 수 있습니다.

Informatica의 도메인 속성

Informatica의 도메인 속성

다음은 Informatica 도메인의 주요 속성입니다.

복원력 시간 초과 – 통합 서비스 또는 저장소 서비스 중 하나라도 작동이 중단되면 복원력 제한 시간은 애플리케이션 서비스가 해당 서비스에 연결을 시도하는 시간(초)입니다.

재시작 기간 – 도메인이 서비스를 다시 시작하는 데 소비하는 최대 시간(초)입니다.

파견 모드 – 로드 밸런서가 다양한 노드에 작업을 디스패치하기 위해 사용하는 정책입니다.

데이터베이스 유형 – 도메인이 구성된 데이터베이스 유형입니다.

데이터베이스 호스트 – 도메인이 구성된 시스템의 호스트 이름입니다.

데이터베이스 포트 & name – 도메인의 데이터베이스 포트 및 데이터베이스 인스턴스 이름입니다.

이러한 속성은 요구 사항에 따라 수정될 수 있습니다.

PowerCenter 클라이언트 및 서버 연결

PowerCenter 클라이언트 도구는 클라이언트 시스템에 설치되는 개발 도구입니다. PowerCenter 디자이너, 워크플로우 관리자, 리포지토리 관리자 및 워크플로우 모니터는 기본 클라이언트 도구입니다.

이러한 클라이언트 도구에서 생성하는 매핑 및 개체는 Informatica 서버에 있는 Informatica 리포지토리에 저장됩니다. 따라서 클라이언트 도구에는 서버에 대한 네트워크 연결이 있어야 합니다.

반면 PowerCenter 클라이언트는 소스 및 대상에 연결하여 메타데이터 및 소스/대상 구조 정의를 가져옵니다. 따라서 소스/타겟 시스템에도 연결되어 있어야 합니다.

  • 통합 서비스 및 리포지토리 서비스에 연결하기 위해 PowerCenter 클라이언트는 TCP/IP 프로토콜을 사용하고
  • 소스/대상에 연결하기 위해 PowerCenter 클라이언트는 ODBC 드라이버를 사용합니다.

Informatica의 리포지토리 서비스

The 리포지토리 서비스 Informatica에서는 PowerCenter 클라이언트에서 PowerCenter 리포지토리로의 연결을 유지 관리합니다. 이는 별도의 다중 스레드 프로세스이며 저장소 내부의 메타데이터를 가져오고 삽입하고 업데이트합니다. 또한 저장소 메타데이터 내부의 일관성을 유지하는 역할도 담당합니다.

Informatica의 리포지토리 서비스
Informatica의 리포지토리 서비스

Informatica의 통합 서비스

통합 서비스는 Informatica의 실행 엔진입니다. 즉, Informatica에서 생성하는 작업을 실행하는 엔터티입니다. 작동 방식은 다음과 같습니다.

  • 사용자가 워크플로를 실행합니다.
  • Informatica는 통합 서비스에 워크플로우를 실행하도록 지시합니다.
  • 통합 서비스는 저장소에서 워크플로 세부 정보를 읽습니다.
  • 통합 서비스가 워크플로우 내에서 작업 실행을 시작합니다.
  • 실행이 완료되면 작업 상태가 업데이트됩니다(예: 실패, 성공 또는 중단).
  • 실행이 완료되면 세션 로그와 워크플로우 로그가 생성됩니다.
  • 이 서비스는 대상 시스템에 데이터를 로드하는 역할을 담당합니다.
  • 통합 서비스는 또한 다양한 소스의 데이터를 결합합니다.

예를 들어, 오라클 테이블과 플랫 파일 소스의 데이터를 결합할 수 있습니다.

요약하자면, Informatica 통합 서비스는 Informatica 서버에 상주하여 실행을 위해 작업이 할당될 때까지 기다리는 프로세스입니다. 워크플로를 실행하면 통합 서비스는 워크플로를 실행하라는 알림을 받습니다. 그런 다음 통합 서비스는 워크플로를 읽어 매핑과 같은 실행해야 할 작업과 어떤 타이밍에 실행해야 하는지와 같은 세부 정보를 파악합니다. 그런 다음 서비스는 리포지토리에서 작업 세부 정보를 읽고 실행을 진행합니다.

소스 & Targets

인포매티카는 ETL 그리고 데이터 통합 ​​도구를 사용하면 항상 어떤 형태의 데이터를 처리하고 변환하게 됩니다. Informatica에서 매핑에 대한 입력은 소스 시스템이라고 합니다. 소스에서 소스 정의를 가져온 다음 소스에 연결하여 매핑에서 소스 데이터를 가져옵니다. 다양한 유형의 소스가 있을 수 있으며 여러 위치에 있을 수 있습니다. 요구 사항에 따라 대상 시스템은 관계형 또는 플랫 파일 시스템이 될 수 있습니다. 플랫 파일 대상은 Informatica 서버 머신에서 생성되며 나중에 ftp를 사용하여 전송할 수 있습니다.

관계형– 이러한 유형의 소스는 데이터베이스 시스템 테이블입니다. 이러한 데이터베이스 시스템은 일반적으로 이 데이터를 생성하고 유지 관리하는 다른 응용 프로그램이 소유합니다. 고객 관계 관리 데이터베이스, 인적 자원 데이터베이스 등이 될 수 있습니다. Informatica에서 이러한 소스를 사용하기 위해 우리는 이러한 데이터 세트의 복제본을 얻거나 이러한 시스템에 대한 선택 권한을 얻습니다.

플랫 파일 – 플랫 파일은 Informatica의 관계형 데이터베이스 다음으로 가장 일반적인 데이터 소스입니다. 플랫 파일은 쉼표로 구분된 파일, 탭으로 구분된 파일 또는 고정 너비 파일일 수 있습니다. Informatica는 ASCII 또는 유니코드와 같은 코드 페이지를 지원합니다. Informatica에서 플랫 파일을 사용하려면 관계형 테이블에서와 마찬가지로 해당 정의를 가져와야 합니다.

요약

  • Informatica PowerCenter의 전체 아키텍처는 다음과 같습니다. 서비스 지향 Archi강의 (소아).
  • Informatica 도메인은 Informatica 도구의 기본 관리 단위입니다.
  • PowerCenter 리포지토리는 다음과 같은 관계형 데이터베이스입니다. Oracle, Sybase, SQL 서버 등을 리포지토리 서비스로 관리합니다.
  • 도메인 구성은 Informatica 관리 콘솔을 사용하여 수행할 수 있습니다.
  • Informatica의 도메인 속성: 복원력 시간 초과, 다시 시작 기간, 디스패치 모드, 데이터베이스 유형, 데이터베이스 호스트, 데이터베이스 포트 및 이름
  • PowerCenter 클라이언트 도구는 클라이언트 시스템에 설치되는 개발 도구입니다.
  • Informatica의 리포지토리 서비스는 PowerCenter 클라이언트에서 PowerCenter 리포지토리로의 연결을 유지 관리합니다.
  • 통합 서비스는 Informatica의 실행 엔진입니다. 즉, Informatica에서 생성하는 작업을 실행하는 엔터티입니다.