Talend Tutorial – Hvad er Talend ETL Tool?
Oversigt over Talentutorial
I denne Talend-tutorial lærer du alle begreberne fra bunden. Denne tutorial dækker grundlæggende til avancerede emner som Hvad er talent, Talend-værktøjets historie, Talend Big data, Fordele ved dataintegration ved hjælp af Talend-værktøj, open-studio-arkitektur og talent open studio-udvidelser. Denne talenttutorial er helt gratis.
Hvad er Talend?
Talent er en open source softwareplatform, som tilbyder dataintegration og datahåndteringsløsninger. Talend har specialiseret sig i big data integration. Dette værktøj giver funktioner som cloud, big data, integration af virksomhedsapplikationer, datakvalitet og masterdatastyring. Det giver også et samlet lager til at gemme og genbruge metadataene.
Den er tilgængelig i både open source og premium version. Det er et af de bedste værktøjer til cloud computing og big data integration.
Talends historie
År | Milestone |
---|---|
2002 | F & U |
2005 | Company Creation- Første finansieringsrunde AGF private equity & Galle Partners |
2006 | Open Studio V1.0- Lancerede os operationer |
2007 | Integrationssuite/ lukket anden finansieringsrunde |
2008 | Åbn Profiler/ Data Quality |
2009 | Integration Suite RTx/MPx/ MDM erhvervelse |
2010 | IDM Community Edition/ MDM Enterprise Edition |
Åbent studie V | |
2014 | OW2 Bedste Projekt |
2015 | Anerkendt trendsættende produkt |
2016 | DBTA 100 |
2017 | Gartner Magic Quadrant for dataintegrationsværktøjer |
2021 | Indbygget integration af søm med Amazon Redshift konsol |
Talend Product Suite
Talend Product Suites består af 3 hovedprodukter som diskuteret nedenfor:
Talent Big Data
Talend tool kan nemt automatisere big data integration med grafiske værktøjer og guider. Dette giver organisationen mulighed for at udvikle et miljø til nemt at arbejde med Apache Hadoop, Sparkog NoSQL databaser til cloud- eller on-premises jobs.
I dag bruger mange virksomheder Hadoop til omkostningsbesparelser og forbedring af ydeevnen. Ofte bruger virksomheder dyr regnetid med virksomhedsløsningerne. Med Hadoop kan data transformeres renset og beriget og integreret til den højere analytiske arbejdsbyrde.
Talend Sandbox inkluderer fire use cases
- Optimering af datavarehus
- Clickstream Analytics
- Analyse af følelser på sociale medier
- Apache weblog analyse.
Du kan oprette dine egne komplekse Use Cases.
Fordele Talend for Big data Hadoop
- Forbedre effektiviteten af big data-jobdesignet ved at arrangere og konfigurere i en grafisk grænseflade.
- Tilføjer datakvalitet, skalerbarhed og administrationsfunktioner
- MapReduce-funktionen giver mulighed for hurtigere parallel databehandling
- Shared Repository og fjernimplementering
- Datakvalitet og profilering med Data Cleansing
- Forbedrer effektiviteten af big data job design med GUI interface
- Indfødt støtte til HBase, HDFS, Hive, SqoopPig
- Indlejret i Hortonworks Data Platform
Dataintegration
Talent dataintegrationssoftware værktøjet har en åben, skalerbar arkitektur. Det giver mulighed for hurtigere respons på forretningsforespørgsler. Værktøjet tilbyder at udvikle og implementere dataintegrationsjob hurtigere end håndkodning.
Det giver dig mulighed for nemt at integrere alle dine data med andre datavarehuse eller synkronisere data mellem systemer. Dataintegration involverer at kombinere data lagret i forskellige kilder og give brugerne et samlet overblik over disse data. Det hjælper dig med at administrere forskellige ETL-job og styrke brugerne med enkel, selvbetjeningsdataforberedelse.
Fordele Talend til dataintegration
Agile integration: Svar hurtigere på forretningsforespørgsler uden at skrive kode ved hjælp af over 1000 out-of-the-box stik, Eclipse-baserede grafiske værktøjer og en optimeret til ydeevne kodegenerator.
Teamets produktivitet: Samarbejd ved hjælp af kraftfuld versionering, konsekvensanalyse, test og fejlfinding og metadatastyring.
Nem styring: Værktøjet tilbyder avancerede planlægnings- og overvågningsfunktioner. Det giver dataintegration i realtid med dashboards og centraliseret kontrol til hurtig implementering på tværs af flere noder.
Vær foran i konkurrencen: Hvis du bruger dette værktøj, behøver du ikke vente på at bruge de nyeste og sejeste dataintegrationsfunktioner.
Betal den laveste pris for ejerskab: Talend-værktøjet tilbyder abonnementsbaseret prismodel. Du skal betale for antallet af udviklere, der bruger Talend Studio og derved spare dig penge sammenlignet med flad licens.
Integrationssky
Du kan accelerere cloud- og on-premises dataintegrationsprojekter ved at bruge meget skalerbar og sikker cloud-integrationsplatform-som-en-tjeneste (iPaaS). Talend integration cloud-værktøj tilbyder forbindelse, indbygget datakvalitet og indbygget kodegenerering.
Talend er sikret cloud-integrationsplatform, som gør det muligt for IT- og forretningsbrugere at forbinde delt både kunne og on-premise. Det låser op for kraften i skydesignjobbet, da det kan administrere, overvåge og kontrollere i skyen.
Næste i denne Talend-tutorial med eksempler vil vi lære om fordelene ved Talend-integrationsskyen i forhold til andre værktøjer.
Integration cloud fordele
Talend Integration Cloud | Andre værktøjer |
---|---|
900+ træk-n-slip komponenter | Håndkodning, som er uproduktiv |
Genererer optimeret kode | Har brug for specialiserede færdigheder |
Samarbejde & ledelse | Svært at vedligeholde |
Guld support (SLA'er) | Begrænset support |
Hvad er Talend Open Studio?
Talend Open Studio er en åben arkitektur til dataintegration, dataprofilering, big data, cloud integration og meget mere.
Det er et GUI-miljø, der tilbyder mere end 1000 forudbyggede stik. Dette gør det nemt at udføre operationer som at transformere filer, indlæse data, flytte og omdøbe filer. Det giver hver komponent mulighed for at definere komplekse processer.
Integrationsjob oprettes fra Talend-komponenter, der er konfigureret i stedet for kodet. Desuden kan jobs køres inde fra udviklingsmiljøet, eller det kan udføres som selvstændige scripts.
Fordele ved at bruge Talend Open studio
- Det reducerer den tid, det tager at udvikle integration fra uger og måneder til dage eller endda timer.
- Det konverterer og opdaterer data fra forskellige kilder.
- Overvåg og administrer vanskelige implementeringer med lethed
- Du kan have de laveste omkostninger ved ejerskab af enhver løsning
- Talend Open Source kan nemt kombinere, konvertere og opdatere data fra forskellige kilder.
- Talend Open Source-værktøj arver den potentielle kraft af programmeringsplatformen.
- Bredt udvalg af kilde-/målforbindelser gør det til det bedste valg på tværs af branchen.
- Leveres med stærk mulighed for multi-skema logfil/afstemningsrapport (efter dataflow/migrering)
Ældre ETL | Talent |
---|---|
Propriety Engine | Åbne |
Svært at skalere Big Data | Genererer indbygget kode |
Dyrt | Lav TCO |
Talend Open Studio- Architecture
Nu i denne Talend Open Studio-tutorial lærer vi om Talend Open Studio-arkitektur. Følgende er de 3 nøglekomponenter i Talend Open Studio Architecture
Klienter
Klientblokken inkluderer en eller flere Talend Studio(s) og webbrowsere, som bruger samme eller forskellige maskiner. Talend Studio giver dig mulighed for at udføre dataintegrationsprocesser uanset niveauet af datamængder og proceskompleksitet.
Talent server
Talend-serveren er en anden vigtig blok, som inkluderer en webbaseret applikationsserver. Det muliggør administration og vedligeholdelse af alle projekter. Det inkluderer brugerkonti, adgangsrettigheder og projektautorisation i administrationsdatabasen.
Database
Databasekomponenten omfatter administration, revision og overvågning af databaser. Denne komponent hjælper med at administrere brugerkonti, adgangsrettigheder og projektautorisation. Revisionsdatabasen hjælper med at evaluere forskellige aspekter af jobs for at udvikle et ideelt procesorienteret beslutningsstøttesystem.
Arbejdsområde
I Talend er et arbejdsområde en mappe, hvor du gemmer alle projektmapper. Til det kræver du dog mindst én arbejdsområdemappe pr. forbindelse (lagerforbindelse). Talend gør det muligt at oprette forbindelse til forskellige mapper på arbejdsområdet, hvis du ikke ønsker at bruge standardbibliotekerne.
Repository
Et lager er det lagerområde, som TOS-værktøjet bruger til at indsamle data til at forklare forretningsmodeller eller til at designe job.
Talend Open Studio-udvidelser
Nu i denne Talend ETL tutorial vil vi lære om Talend open studio extensions:
- Talend Integration Suite
- Talent On Demand
- Talende datakvalitet
- Talent ESB
- Talend Big Data Integration
Konklusion
- Talend er en open source softwareplatform, som tilbyder dataintegration og datahåndteringsløsninger
- Talend-software kan nemt automatisere big data-integration med grafiske værktøjer og guider
- Talend Product Suite består af 3 hovedprodukter 1) Talend Big Data 2) Dataintegration 3) Integration Cloud
- Talend tilbyder Dataintegritet, Datamapping og batchbehandling til Big Data og Dataintegration.
- Talent ETL værktøj forbedrer effektiviteten af big data-jobdesignet ved at arrangere og konfigurere i en grafisk grænseflade
- Talend dataintegrationssoftwareværktøj har en åben, skalerbar arkitektur. Det giver mulighed for hurtigere respons på forretningsforespørgsler.
- Talend integration cloud-værktøj tilbyder forbindelse, indbygget datakvalitet og indbygget kodegenerering.
- Talend Open Studio er en åben arkitektur til dataintegration, dataprofilering, big data, cloud integration og meget mere.
- Fem Talend-studieudvidelser er: Talend Integration Suite, Talend On Demand, Talend Data Quality, Talend Seanad Talend Big Data Integration