Урок за Talend – Какво представлява инструментът Talend ETL?
Резюме на урока за Talend
В този урок за Talend ще научите всички концепции от нулата. Този урок обхваща основни до напреднали теми като какво е talend, история на инструмента talend, големи данни на talend, предимства на интегрирането на данни с помощта на инструмента talend, архитектура на отворено студио и разширения на отворено студио на talend. Този урок за таланти е абсолютно безплатен.
Какво е Talend?
Таленд е софтуерна платформа с отворен код, която предлага интеграция на данни и решения за управление на данни. Talend е специализирана в интегрирането на големи данни. Този инструмент предоставя функции като облак, големи данни, интеграция на корпоративни приложения, качество на данните и управление на основни данни. Той също така предоставя унифицирано хранилище за съхраняване и повторно използване на метаданните.
Предлага се както във версия с отворен код, така и в премиум версия. Това е един от най-добрите инструменти за облачни изчисления и голямо количество от данни интеграция.
История на Talend
година | Важно събитие |
---|---|
2002 | R & D |
2005 | Създаване на компания - Първи кръг от финансиране на AGF private equity & Galle Partners |
2006 | Open Studio V1.0 - Стартирахме операциите с нас |
2007 | Интеграционен пакет/ затворен втори кръг на финансиране |
2008 | Отворете Profiler/ Data Quality |
2009 | Интеграционен пакет RTx/MPx/ MDM придобиване |
2010 | IDM Community Edition/ MDM Enterprise Edition |
Отворено студио V | |
2014 | OW2 Най-добър проект |
2015 | Признат модерен продукт |
2016 | DBTA 100 |
2017 | Магически квадрант на Gartner за инструменти за интегриране на данни |
2021 | Родна интеграция на Stitch с Amazon Redshift конзола |
Продуктов пакет Talend
Продуктовите пакети Talend се състоят от 3 основни продукта, както е обсъдено по-долу:
Talend Big Data
Инструментът Talend може лесно да автоматизира интегрирането на големи данни с графични инструменти и съветници. Това позволява на организацията да разработи среда за лесна работа с Apache Hadoop, Spark, и NoSQL бази данни за облачни или локални работни места.
Днес много компании използват Hadoop за спестяване на разходи и подобряване на производителността. Често компаниите използват скъпо изчислително време с корпоративните решения. С Hadoop данните могат да бъдат преобразувани, изчистени и обогатени и интегрирани за по-голямо аналитично натоварване.
Talend Sandbox включва четири случая на употреба
- Оптимизация на складове за данни
- Clickstream Analytics
- Анализ на настроенията в социалните медии
- Анализ на уеблог на Apache.
Можете да създадете свои собствени сложни случаи на употреба.
Ползи Talend за големи данни Hadoop
- Подобрете ефективността на проектирането на работа с големи данни чрез подреждане и конфигуриране в графичен интерфейс.
- Добавя функции за качество на данните, мащабируемост и управление
- Функцията MapReduce позволява по-бърза паралелна обработка на данни
- Споделено хранилище и отдалечено внедряване
- Качество на данните и профилиране с Data Cleansing
- Подобрява ефективността на проектирането на работа с големи данни с GUI интерфейс
- Вградена поддръжка за HBase, HDFS, кошер, SqoopPig
- Вграден в Hortonworks Data Platform
Интеграция на данни
Таленд софтуер за интегриране на данни инструментът има отворена, мащабируема архитектура. Позволява по-бърз отговор на бизнес заявки. Инструментът предлага разработване и внедряване на задачи за интегриране на данни по-бързо от ръчното кодиране.
Тя ви позволява лесно да интегрирате всичките си данни с други хранилища за данни или да синхронизирате данни между системите. Интегрирането на данни включва комбиниране на данни, съхранявани в различни източници, и предоставяне на унифициран изглед на потребителите на тези данни. Той ви помага да управлявате различни ETL задачи и дава възможност на потребителите с проста подготовка на данни за самообслужване.
Ползи Talend за интегриране на данни
Гъвкава интеграция: Отговаряйте по-бързо на бизнес заявки, без да пишете код, като използвате над 1000 конектора извън кутията, Eclipse-базирани графични инструменти и оптимизиран за производителност генератор на код.
Продуктивност на екипа: Сътрудничете си, като използвате мощни версии, анализ на въздействието, тестване и отстраняване на грешки и управление на метаданни.
Лесно управление: Инструментът предлага разширени функции за планиране и наблюдение. Той осигурява интеграция на данни в реално време с табла за управление и централизиран контрол за бързо внедряване в множество възли.
Останете напред в конкуренцията: Ако използвате този инструмент, няма да се налага да чакате да използвате най-новите и най-готините функции за интегриране на данни.
Платете най-ниската цена за собственост: Инструментът Talend предлага модел на ценообразуване, базиран на абонамент. Трябва да платите за броя на разработчиците, които използват Talend Studio, като по този начин спестявате пари в сравнение с плоския лиценз.
Интеграционен облак
Можете да ускорите проектите за интегриране на облачни и локални данни, като използвате силно мащабируема и сигурна платформа за интегриране на облачни услуги като услуга (iPaaS). Облачният инструмент за интегриране на Talend предлага свързаност, вградено качество на данните и генериране на собствен код.
Talend е защитена платформа за облачна интеграция, която позволява на ИТ и бизнес потребителите да се свързват споделено, както могат, така и на място. Той отключва силата на облачната работа, тъй като може да управлява, наблюдава и контролира в облака.
След това в този урок за Talend с примери ще научим за предимствата на интеграционния облак на Talend пред други инструменти.
Ползи от интегрирания облак
Talend Integration Cloud | Други инструменти |
---|---|
900+ компонента за плъзгане и пускане | Ръчно кодиране, което е непродуктивно |
Генерира оптимизиран код | Необходими са специализирани умения |
Сътрудничество и управление | Трудно се поддържа |
Златна поддръжка (SLA) | Ограничена подкрепа |
Какво е Talend Open Studio?
Talend Open Studio е отворена архитектура за интегриране на данни, профилиране на данни, големи данни, облачна интеграция и др.
Това е GUI среда, която предлага повече от 1000 предварително изградени конектора. Това улеснява извършването на операции като трансформиране на файлове, зареждане на данни, преместване и преименуване на файлове. Тя позволява на всеки компонент да дефинира сложни процеси.
Задачите за интегриране се създават от компоненти на Talend, които са конфигурирани вместо кодирани. Освен това заданията могат да се изпълняват от средата за разработка или могат да се изпълняват като самостоятелни скриптове.
Ползи от използването на Talend Open studio
- Това намалява времето, необходимо за разработване на интеграция от седмици и месеци до дни или дори часове.
- Той преобразува и актуализира данни, налични от различни източници.
- Наблюдавайте и управлявайте трудни внедрявания с лекота
- Можете да имате най-ниската цена на притежание от всяко решение
- Talend Open Source може лесно да комбинира, конвертира и актуализира данни от различни източници.
- Talend Инструмент с отворен код Наследява потенциалната мощ на платформата за програмиране.
- Широкият избор от конектори източник/цель го прави най-добрият избор в индустрията.
- Предлага се със силни възможности за регистрационен файл с множество схеми/отчет за съгласуване (след поток от данни/миграция)
Наследен ETL | Таленд |
---|---|
Двигател за собственост | отворено |
Трудни за мащабиране големи данни | Генерира естествен код |
Скъп | Нисък TCO |
Talend Open Studio- Archiтекстура
Сега в този урок за Talend Open Studio ще научим за архитектурата на Talend Open Studio. Следват 3-те ключови компонента на Talend Open Studio Archiтекстура
Клиенти
Блокът Клиенти включва едно или повече Talend Studio(s) и уеб браузъри, които използват едни и същи или различни машини. Talend Studio ви позволява да изпълнявате процеси за интегриране на данни, независимо от нивото на обема на данните и сложността на процеса.
Talend сървър
Сървърът Talend е друг важен блок, който включва уеб базиран сървър за приложения. Позволява администриране и поддръжка на всички проекти. Той включва потребителски акаунти, права за достъп и оторизация на проекта в базата данни на администрацията.
База данни
Компонентът Бази данни включва Администриране, Одит и Мониторинг на бази данни. Този компонент помага за управление на потребителски акаунти, права за достъп и оторизация на проекта. Базата данни за одит помага да се оценят различни аспекти на работните места за разработване на идеална ориентирана към процеса система за подпомагане на вземането на решения.
Работно пространство
В Talend работното пространство е директория, в която съхранявате всички папки на проекта. За това обаче ще ви е необходима поне една директория на работното пространство на връзка (връзка към хранилище). Talend позволява свързване с различни директории на работното пространство, в случай че не искате да използвате директориите по подразбиране.
хранилище
Хранилището е зоната за съхранение, която TOS инструментът използва за събиране на данни за обяснение на бизнес модели или за проектиране на работни места.
Разширения на Talend Open Studio
Сега в този урок за Talend ETL ще научим за отворените разширения на Talend studio:
- Интеграционен пакет Talend
- Talend при поискване
- Качество на данните на Talend
- Talend ESB
- Talend Big Data Integration
Заключение
- Talend е софтуерна платформа с отворен код, която предлага интеграция на данни и решения за управление на данни
- Софтуерът Talend може лесно да автоматизира интегрирането на големи данни с графични инструменти и съветници
- Talend Product Suite се състои от 3 основни продукта 1) Talend Big Data 2) Интегриране на данни 3) Интеграционен облак
- Talend предлага цялост на данните, картографиране на данни и пакетна обработка за големи данни и интеграция на данни.
- Таленд ETL инструмент подобрява ефективността на проектирането на работа с големи данни чрез подреждане и конфигуриране в графичен интерфейс
- Софтуерният инструмент за интегриране на данни Talend има отворена, мащабируема архитектура. Позволява по-бърз отговор на бизнес заявки.
- Облачният инструмент за интегриране на Talend предлага свързаност, вградено качество на данните и генериране на собствен код.
- Talend Open Studio е отворена архитектура за интегриране на данни, профилиране на данни, големи данни, облачна интеграция и др.
- Пет разширения на Talend studio са: Talend Integration Suite, Talend On Demand, Talend Data Quality, Talend Seanad Talend Big Data Integration