Esercitazione su Informatica PowerCenter: Architecnologia, componenti
Elaborazione PowerCenter Architectura
L'architettura complessiva di Informatica PowerCenter è orientata ai servizi Architecture (SOA). L'architettura dello strumento ETL di Informatica è composta dai seguenti servizi e componenti:
- Servizio di archivio – Responsabile del mantenimento dei metadati di Informatica e della fornitura dell'accesso agli stessi ad altri servizi.
- Servizio di integrazione – Responsabile del movimento dei dati dalle fonti agli obiettivi
- Servizio di segnalazione – Abilita la generazione di report
- Nodes – Piattaforma informatica dove vengono eseguiti i servizi di cui sopra
- Progettista informatico – Utilizzato per la creazione di mappature tra origine e destinazione
- Responsabile del flusso di lavoro – Utilizzato per creare flussi di lavoro e altre attività e la loro esecuzione
- Monitoraggio del flusso di lavoro – Utilizzato per monitorare l'esecuzione dei flussi di lavoro
- Gestore repository – Utilizzato per gestire gli oggetti nel repository

Dominio Informatica
Il dominio Informatica è l'unità amministrativa fondamentale nello strumento Informatica. È una raccolta di nodi e servizi. Inoltre, questi nodi e servizi possono essere classificati in cartelle e sottocartelle in base ai requisiti di amministrazione.
Ad esempio, nello screenshot qui sotto, puoi vedere nella finestra del dominio la cartella "Domain_Rajesh" creata sotto la quale abbiamo creato un nome nodo "node01_rajesh" e servizi come "servizi di integrazione guru99".
Il nodo è una rappresentazione logica di una macchina all'interno del dominio. Il nodo è necessario per eseguire servizi e processi per Informatica.
Puoi avere più nodi in un dominio. In un dominio troverai anche un nodo gateway.
Il nodo gateway è responsabile della ricezione delle richieste da diversi strumenti client e dell'instradamento di tali richieste a diversi nodi e servizi.
Esistono due tipi di servizi in Domain
- Service manager: il gestore servizi gestisce le operazioni del dominio come l'autenticazione, l'autorizzazione e la registrazione. Gestisce inoltre i servizi applicativi sui nodi e gestisce utenti e gruppi.
- Servizi applicativi: il servizio dell'applicazione rappresenta i servizi specifici del server come il servizio di integrazione, il servizio di repository e il servizio di reporting. Questi servizi vengono eseguiti su nodi diversi in base alla configurazione.
Repository di Informatica PowerCenter
Il repository PowerCenter è un database relazionale simile Oracle, Sybase, SQL server ed è gestito dal servizio di repository. È costituito da tabelle di database che memorizzano metadati.
In Informatica PowerCenter sono disponibili tre strumenti Informatica Client. Sono Informatica
- Designer
- Monitoraggio del flusso di lavoro
- Responsabile del flusso di lavoro
Questi client possono accedere al repository solo utilizzando il servizio repository.
Per gestire un repository esiste un servizio di Informatica chiamato Repository Service. Un singolo servizio di repository gestisce esclusivamente un solo repository. Inoltre, un servizio di repository può essere eseguito su più nodi per aumentare le prestazioni.
I servizi di repository utilizzano blocchi sugli oggetti, pertanto più utenti non possono modificare lo stesso oggetto contemporaneamente.
È possibile abilitare il controllo della versione nel repository. Con la funzionalità di controllo della versione, puoi mantenere diverse versioni dello stesso oggetto.
Gli oggetti creati nel repository possono avere i seguenti tre stati
- Valido: Gli oggetti validi sono quegli oggetti la cui sintassi è corretta secondo Informatica. Questi oggetti possono essere utilizzati nell'esecuzione dei flussi di lavoro.
- invalido: Gli oggetti non validi sono quelli che non aderiscono allo standard o alle regole specificate. Quando un oggetto viene salvato in Informatica, viene controllato se la sua sintassi e proprietà sono valide o meno e l'oggetto viene contrassegnato con lo stato di conseguenza.
- impattato: gli oggetti interessati sono quelli i cui oggetti secondari non sono validi. Ad esempio, se in una mappatura si utilizza una trasformazione riutilizzabile e questo oggetto di trasformazione diventa non valido, la mappatura verrà contrassegnata come interessata.
Configurazione del dominio in Informatica
Come accennato in precedenza, il dominio rappresenta il controllo amministrativo di base in Informatica. È l'entità madre composta da altri servizi come il servizio di integrazione, il servizio di repository e vari nodi.
La configurazione del dominio può essere eseguita utilizzando la console di amministrazione di Informatica. La console può essere avviata utilizzando i browser Web.
Una volta aperto in un browser Web, richiede l'accesso come amministratore. La password viene impostata durante l'installazione di Informatica.
Dopo aver effettuato l'accesso al dominio Informatica, la home page è simile a questa.
Nel riquadro di sinistra vengono visualizzati i nodi esistenti, i servizi di repository e i servizi di integrazione nel dominio.
Nella finestra principale, mostra lo stato di tali servizi, se sono attivi o inattivi.
Proprietà del Dominio in Informatica
Fare clic sul menu Proprietà nella pagina di amministrazione per visualizzare le proprietà del dominio.
Di seguito sono riportate le proprietà chiave del Dominio in Informatica:
Timeout della resilienza – Se uno qualsiasi dei servizi di integrazione o di repository si interrompe, il timeout di resilienza è il numero di secondi in cui il servizio applicativo tenta di connettersi a tali servizi.
Periodo di riavvio – È il numero massimo di secondi che il dominio impiega per riavviare un servizio.
Modalità di spedizione – È la policy utilizzata dal sistema di bilanciamento del carico per inviare attività a vari nodi.
Tipo di database – Il tipo di database su cui è configurato il dominio.
Host del database – Nome host della macchina su cui è configurato il dominio.
Porta del database & Nome – È la porta del database e il nome dell'istanza del database per il dominio.
Queste proprietà possono essere modificate in base alle esigenze.
Connettività client e server PowerCenter
Gli strumenti client di PowerCenter sono strumenti di sviluppo installati sulle macchine client. PowerCenter Designer, gestore del flusso di lavoro, gestore di repository e monitor del flusso di lavoro sono i principali strumenti client.
Le mappature e gli oggetti che creiamo in questi strumenti client vengono salvati nel repository Informatica che risiede sul server Informatica. Pertanto gli strumenti client devono disporre di connettività di rete al server.
D'altro canto, il client PowerCenter si connette alle origini e alle destinazioni per importare i metadati e le definizioni della struttura di origine/destinazione. Quindi deve anche avere connettività ai sistemi di origine/destinazione.
- Per connettersi al servizio di integrazione e al servizio di repository, il client PowerCenter utilizza i protocolli TCP/IP e
- Per connettersi alle origini/destinazioni il client PowerCenter utilizza i driver ODBC.
Servizio di repository in Informatica
Servizio di archivio in Informatica mantiene le connessioni dai client PowerCenter al repository PowerCenter. È un processo multi-thread separato e recupera, inserisce e aggiorna i metadati all'interno del repository. È anche responsabile del mantenimento della coerenza all'interno dei metadati del repository.
Servizio di integrazione in Informatica
Il servizio di integrazione è il motore di esecuzione di Informatica, in altre parole, questa è l'entità che esegue le attività che creiamo in Informatica. Ecco come funziona:
- Un utente esegue un flusso di lavoro
- Informatica istruisce il servizio di integrazione ad eseguire il flusso di lavoro
- Il servizio di integrazione legge i dettagli del flusso di lavoro dal repository
- Il servizio di integrazione avvia l'esecuzione delle attività all'interno del flusso di lavoro
- Una volta completata l'esecuzione, lo stato dell'attività viene aggiornato, ovvero non riuscita, riuscita o interrotta.
- Al termine dell'esecuzione, vengono generati il registro della sessione e il registro del flusso di lavoro.
- Questo servizio è responsabile del caricamento dei dati nei sistemi di destinazione
- Il servizio di integrazione combina anche dati provenienti da diverse fonti
Ad esempio, può combinare i dati di una tabella Oracle e di un'origine file flat.
Quindi, in sintesi, Informatica integration service è un processo che risiede sul server Informatica in attesa che vengano assegnate attività per l'esecuzione. Quando eseguiamo un flusso di lavoro, il servizio di integrazione riceve una notifica per eseguire il flusso di lavoro. Quindi il servizio di integrazione legge il flusso di lavoro per conoscere i dettagli come quali attività deve eseguire come mapping e in quali tempi. Quindi il servizio legge i dettagli delle attività dal repository e procede con l'esecuzione.
Fonti & Targets
Informatica è un ETL e Strumento di integrazione dati, dovresti sempre gestire e trasformare una qualche forma di dati. L'input per le nostre mappature in Informatica è chiamato sistema sorgente. Importiamo le definizioni sorgente dalla sorgente e quindi ci colleghiamo ad essa per recuperare i dati sorgente nelle nostre mappature. Possono esserci diversi tipi di sorgenti e possono essere ubicate in più posizioni. In base alle tue esigenze, il sistema di destinazione può essere un file system relazionale o flat. I target dei file flat vengono generati sulla macchina server Informatica, che può essere trasferita in seguito tramite ftp.
Relazionale– questi tipi di origini sono tabelle di sistema del database. Questi sistemi di database sono generalmente di proprietà di altre applicazioni che creano e mantengono questi dati. Può essere un database di gestione delle relazioni con i clienti, un database delle risorse umane, ecc. Per l'utilizzo di tali fonti in Informatica otteniamo una replica di questi set di dati oppure otteniamo privilegi selezionati su questi sistemi.
Lime flat – I file flat sono le origini dati più comuni dopo i database relazionali in Informatica. Un file flat può essere un file separato da virgole, un file delimitato da tabulazioni o un file a larghezza fissa. Informatica supporta qualsiasi tabella codici come ASCII o Unicode. Per utilizzare il file flat in Informatica, le sue definizioni devono essere importate in modo simile a quanto facciamo per le tabelle relazionali.
Sommario
- L'architettura complessiva di Informatica PowerCenter è Orientato al servizio Architectura (SOA).
- Il dominio Informatica è l'unità amministrativa fondamentale nello strumento Informatica.
- Il repository PowerCenter è un database relazionale simile Oracle, Sybase, SQL server ed è gestito dal servizio repository.
- La configurazione del dominio può essere eseguita utilizzando la console di amministrazione di Informatica.
- Proprietà del dominio in Informatica: timeout di resilienza, periodo di riavvio, modalità di invio, tipo di database, host del database e porta e nome del database
- Gli strumenti client di PowerCenter sono strumenti di sviluppo installati sulle macchine client.
- Il servizio repository in Informatica mantiene le connessioni dai client PowerCenter al repository PowerCenter.
- Il servizio di integrazione è il motore di esecuzione di Informatica, in altre parole, questa è l'entità che esegue le attività che creiamo in Informatica.