Hướng dẫn về Informatica PowerCenter: Archikiến trúc, thành phần

Trung tâm năng lượng Informatica Archikiến trúc

Kiến trúc tổng thể của Informatica PowerCenter là hướng dịch vụ Archikiến trúc (SOA). Kiến trúc công cụ ETL của Informatica bao gồm các dịch vụ và thành phần sau:

  1. Dịch vụ lưu trữ – Chịu trách nhiệm duy trì siêu dữ liệu Informatica và cung cấp quyền truy cập tương tự vào các dịch vụ khác.
  2. Dịch vụ tích hợp – Chịu trách nhiệm di chuyển dữ liệu từ nguồn đến đích
  3. Dịch vụ báo cáo – Cho phép tạo báo cáo
  4. Nodes – Nền tảng máy tính nơi thực hiện các dịch vụ trên
  5. Nhà thiết kế tin học – Được sử dụng để tạo ánh xạ giữa nguồn và đích
  6. Trình quản lý luồng công việc – Được sử dụng để tạo quy trình công việc và nhiệm vụ khác cũng như việc thực hiện chúng
  7. Giám sát quy trình làm việc – Dùng để giám sát việc thực hiện các quy trình công việc
  8. Quản lý kho lưu trữ – Dùng để quản lý các đối tượng trong kho lưu trữ
Tin học Archisơ đồ kiến ​​trúc
Tin học Archisơ đồ kiến ​​trúc

Tên miền tin học

Miền Informatica là đơn vị quản trị cơ bản trong công cụ Informatica. Nó là một tập hợp các nút và dịch vụ. Hơn nữa, các nút và dịch vụ này có thể được phân loại thành các thư mục và thư mục con dựa trên yêu cầu quản trị.

Ví dụ: trong ảnh chụp màn hình bên dưới, bạn có thể thấy trong cửa sổ miền, thư mục “Domain_Rajesh” được tạo, trong đó chúng tôi đã tạo tên nút “node01_rajesh” và các dịch vụ là “dịch vụ tích hợp guru99”.

Tên miền trong Informatica
Tên miền trong Informatica

Nút là sự biểu diễn logic của một máy bên trong miền. Cần có nút để chạy các dịch vụ và quy trình cho Informatica.

Bạn có thể có nhiều nút trong một miền. Trong một miền, bạn cũng sẽ tìm thấy một nút cổng.

Nút cổng chịu trách nhiệm nhận yêu cầu từ các công cụ máy khách khác nhau và định tuyến các yêu cầu đó đến các nút và dịch vụ khác nhau.

Có hai loại dịch vụ trong Domain

  • Dịch vụ quản lý: Trình quản lý dịch vụ quản lý các hoạt động của miền như xác thực, ủy quyền và ghi nhật ký. Nó cũng chạy các dịch vụ ứng dụng trên các nút cũng như quản lý người dùng và nhóm.
  • Dịch vụ ứng dụng: Dịch vụ ứng dụng đại diện cho các dịch vụ cụ thể của máy chủ như dịch vụ tích hợp, dịch vụ kho lưu trữ và dịch vụ báo cáo. Các dịch vụ này chạy trên các nút khác nhau dựa trên cấu hình.

Kho lưu trữ PowerCenter Informatica

Kho lưu trữ PowerCenter là một cơ sở dữ liệu quan hệ như Oracle, Sybase, SQL máy chủ và nó được quản lý bởi dịch vụ kho lưu trữ. Nó bao gồm các bảng cơ sở dữ liệu lưu trữ siêu dữ liệu.

Có ba công cụ Informatica Client có sẵn trong Informatica PowerCenter. Họ là Informatica

  • nhà thiết kế
  • Giám sát quy trình làm việc
  • Trình quản lý luồng công việc

Những khách hàng này chỉ có thể truy cập vào kho lưu trữ bằng dịch vụ kho lưu trữ.

Để quản lý kho lưu trữ, tồn tại một dịch vụ Informatica có tên là Dịch vụ kho lưu trữ. Một dịch vụ kho lưu trữ duy nhất chỉ xử lý một kho lưu trữ. Ngoài ra, dịch vụ kho lưu trữ có thể thực thi trên nhiều nút để tăng hiệu suất.

Các dịch vụ kho lưu trữ sử dụng khóa trên các đối tượng, do đó nhiều người dùng không thể sửa đổi cùng một đối tượng cùng một lúc.

Bạn có thể kích hoạt kiểm soát phiên bản trong kho lưu trữ. Với tính năng kiểm soát phiên bản, bạn có thể duy trì các phiên bản khác nhau của cùng một đối tượng.

Các đối tượng được tạo trong kho lưu trữ có thể có ba trạng thái sau

  • Hợp lệ: Đối tượng hợp lệ là những đối tượng có cú pháp đúng theo Informatica. Những đối tượng này có thể được sử dụng trong việc thực hiện quy trình công việc.
  • Không hợp lệ: Đối tượng không hợp lệ là những đối tượng không tuân thủ tiêu chuẩn hoặc quy tắc được chỉ định. Khi bất kỳ đối tượng nào được lưu trong Informatica, nó sẽ được kiểm tra xem cú pháp và thuộc tính của nó có hợp lệ hay không và đối tượng đó sẽ được đánh dấu trạng thái tương ứng.
  • Bị ảnh hưởng: Đối tượng bị ảnh hưởng là đối tượng có đối tượng con không hợp lệ. Ví dụ: trong ánh xạ nếu bạn đang sử dụng một phép biến đổi có thể sử dụng lại và đối tượng biến đổi này trở nên không hợp lệ thì ánh xạ sẽ được đánh dấu là bị ảnh hưởng.

Cấu hình tên miền trong Informatica

Như đã đề cập trước đó, miền là quyền kiểm soát quản trị cơ bản trong Informatica. Đây là thực thể mẹ bao gồm các dịch vụ khác như dịch vụ tích hợp, dịch vụ kho lưu trữ và các nút khác nhau.

Việc cấu hình miền có thể được thực hiện bằng bảng điều khiển dành cho quản trị viên Informatica. Bảng điều khiển có thể được khởi chạy bằng trình duyệt web.

Cấu hình tên miền trong Informatica

Sau khi mở trong trình duyệt web, nó sẽ nhắc đăng nhập quản trị viên. Mật khẩu được đặt trong quá trình cài đặt Informatica.

Cấu hình tên miền trong Informatica

Sau khi đăng nhập vào miền Informatica, trang chủ trông như thế này.

Cấu hình tên miền trong Informatica

Trong khung bên trái, nó hiển thị các nút hiện có, dịch vụ kho lưu trữ, dịch vụ tích hợp trong miền.

Trên cửa sổ chính, nó hiển thị trạng thái của các dịch vụ đó, dù chúng đang hoạt động hay không.

Thuộc tính của tên miền trong Informatica

Nhấp vào menu thuộc tính trong trang quản trị để xem các thuộc tính của miền.

Thuộc tính của tên miền trong Informatica

Thuộc tính của tên miền trong Informatica

Dưới đây là các thuộc tính chính của Tên miền trong Informatica:

Hết thời gian phục hồi – Nếu bất kỳ dịch vụ tích hợp hoặc dịch vụ kho lưu trữ nào ngừng hoạt động thì thời gian chờ phục hồi là số giây mà dịch vụ ứng dụng cố gắng kết nối với các dịch vụ đó.

Thời gian khởi động lại – Đó là số giây tối đa mà miền dành để khởi động lại dịch vụ.

Chế độ điều phối – Đó là chính sách được bộ cân bằng tải sử dụng để gửi nhiệm vụ đến các nút khác nhau.

Loại cơ sở dữ liệu – Loại cơ sở dữ liệu mà miền được cấu hình.

Máy chủ cơ sở dữ liệu – Tên máy chủ của máy được cấu hình tên miền.

Cổng cơ sở dữ liệu & tên – Đây là cổng cơ sở dữ liệu và tên phiên bản cơ sở dữ liệu cho miền.

Những thuộc tính này có thể được sửa đổi dựa trên yêu cầu.

Kết nối máy khách và máy chủ PowerCenter

Công cụ máy khách PowerCenter là các công cụ phát triển được cài đặt trên máy khách. Trình thiết kế PowerCenter, trình quản lý quy trình làm việc, trình quản lý kho lưu trữ và trình giám sát quy trình làm việc là những công cụ chính của máy khách.

Các ánh xạ và đối tượng mà chúng tôi tạo trong các công cụ máy khách này được lưu trong kho lưu trữ Informatica nằm trên máy chủ Informatica. Vì vậy các công cụ client phải có kết nối mạng với máy chủ.

Mặt khác, máy khách PowerCenter kết nối với các nguồn và đích để nhập siêu dữ liệu và định nghĩa cấu trúc nguồn/đích. Vì vậy, nó cũng phải có khả năng kết nối với hệ thống nguồn/đích.

  • Để kết nối với dịch vụ tích hợp và dịch vụ kho lưu trữ, máy khách PowerCenter sử dụng giao thức TCP/IP và
  • Để kết nối với nguồn/đích, máy khách PowerCenter sử dụng trình điều khiển ODBC.

Dịch vụ lưu trữ trong Informatica

Dịch vụ lưu trữ trong Informatica duy trì các kết nối từ máy khách PowerCenter đến kho lưu trữ PowerCenter. Đây là một quy trình đa luồng riêng biệt và nó tìm nạp, chèn và cập nhật siêu dữ liệu bên trong kho lưu trữ. Nó cũng chịu trách nhiệm duy trì tính nhất quán bên trong siêu dữ liệu của kho lưu trữ.

Dịch vụ lưu trữ trong Informatica
Dịch vụ lưu trữ trong Informatica

Dịch vụ tích hợp trong Informatica

Dịch vụ tích hợp là công cụ thực thi cho Informatica, hay nói cách khác đây là thực thể thực thi các tác vụ mà chúng ta tạo ra trong Informatica. Đây là cách nó hoạt động:

  • Người dùng thực hiện một quy trình làm việc
  • Informatica hướng dẫn dịch vụ tích hợp thực hiện quy trình công việc
  • Dịch vụ tích hợp đọc thông tin chi tiết về quy trình làm việc từ kho lưu trữ
  • Dịch vụ tích hợp bắt đầu thực thi các tác vụ bên trong quy trình làm việc
  • Sau khi thực hiện xong, trạng thái của tác vụ sẽ được cập nhật tức là không thành công, thành công hoặc bị hủy bỏ.
  • Sau khi hoàn thành việc thực thi, nhật ký phiên và nhật ký quy trình làm việc sẽ được tạo.
  • Dịch vụ này chịu trách nhiệm tải dữ liệu vào hệ thống đích
  • Dịch vụ tích hợp còn kết hợp dữ liệu từ nhiều nguồn khác nhau

Ví dụ, nó có thể kết hợp dữ liệu từ bảng Oracle và nguồn tệp phẳng.

Tóm lại, dịch vụ tích hợp Informatica là một quy trình nằm trên máy chủ Informatica chờ các tác vụ được chỉ định để thực hiện. Khi chúng ta thực hiện một quy trình công việc, dịch vụ tích hợp sẽ nhận được thông báo để thực hiện quy trình công việc. Sau đó, dịch vụ tích hợp sẽ đọc quy trình công việc để biết các chi tiết như tác vụ nào cần thực hiện như ánh xạ và thời gian nào. Sau đó, dịch vụ sẽ đọc các chi tiết tác vụ từ kho lưu trữ và tiến hành thực hiện.

Nguồn & Targets

Informatica là một ETL và Công cụ tích hợp dữ liệu, bạn sẽ luôn xử lý và chuyển đổi một số dạng dữ liệu. Đầu vào cho các ánh xạ của chúng tôi trong Informatica được gọi là hệ thống nguồn. Chúng tôi nhập các định nghĩa nguồn từ nguồn và sau đó kết nối với nó để lấy dữ liệu nguồn trong các ánh xạ của chúng tôi. Có thể có nhiều loại nguồn khác nhau và có thể được đặt tại nhiều vị trí. Dựa trên yêu cầu của bạn, hệ thống mục tiêu có thể là hệ thống tệp quan hệ hoặc tệp phẳng. Các mục tiêu tệp phẳng được tạo trên máy chủ Informatica, có thể được chuyển sau này bằng ftp.

Quan hệ– những loại nguồn này là các bảng hệ thống cơ sở dữ liệu. Các hệ thống cơ sở dữ liệu này thường thuộc sở hữu của các ứng dụng khác tạo và duy trì dữ liệu này. Đó có thể là Cơ sở dữ liệu quản lý quan hệ khách hàng, Cơ sở dữ liệu nguồn nhân lực, v.v. để sử dụng các nguồn như vậy trong Informatica, chúng tôi có thể nhận được bản sao của các bộ dữ liệu này hoặc chúng tôi nhận được các đặc quyền chọn lọc trên các hệ thống này.

Các tập tin phẳng - Tệp phẳng là nguồn dữ liệu phổ biến nhất sau cơ sở dữ liệu quan hệ trong Informatica. Tệp phẳng có thể là tệp được phân tách bằng dấu phẩy, tệp được phân cách bằng tab hoặc tệp có chiều rộng cố định. Informatica hỗ trợ bất kỳ trang mã nào như ascii hoặc Unicode. Để sử dụng tệp phẳng trong Informatica, các định nghĩa của nó phải được nhập tương tự như cách chúng ta thực hiện đối với các bảng quan hệ.

Tổng kết

  • Kiến trúc tổng thể của Informatica PowerCenter là Định hướng dịch vụ Archikiến trúc (SOA).
  • Miền Informatica là đơn vị quản trị cơ bản trong công cụ Informatica.
  • Kho lưu trữ PowerCenter là một cơ sở dữ liệu quan hệ như Oracle, Sybase, SQL server và được quản lý bởi dịch vụ kho lưu trữ.
  • Việc cấu hình miền có thể được thực hiện bằng bảng điều khiển dành cho quản trị viên Informatica.
  • Thuộc tính của Miền trong Informatica: Thời gian chờ phục hồi, Thời gian khởi động lại, Chế độ gửi, loại cơ sở dữ liệu, máy chủ cơ sở dữ liệu cũng như cổng và tên cơ sở dữ liệu
  • Công cụ máy khách PowerCenter là các công cụ phát triển được cài đặt trên máy khách.
  • Dịch vụ Kho lưu trữ trong Informatica duy trì các kết nối từ máy khách PowerCenter đến kho lưu trữ PowerCenter.
  • Dịch vụ tích hợp là công cụ thực thi cho Informatica, hay nói cách khác đây là thực thể thực thi các tác vụ mà chúng ta tạo ra trong Informatica.