Урок за интеграция на данни в Pentaho
Какво е Pentaho BI?
Пентахо е инструмент за бизнес разузнаване, който предоставя широка гама от решения за бизнес разузнаване на клиентите. Той е способен на отчитане, анализ на данни, интегриране на данни, извличане на данни и т.н. Pentaho също предлага изчерпателен набор от BI функции, които ви позволяват да подобрите ефективността и ефективността на бизнеса.
Характеристики на Pentaho
Следват важни характеристики на Pentaho:
- Възможности на ETL за нуждите на бизнес разузнаването
- Разбиране на Pentaho Report Designer
- Продуктова експертиза
- Предлага паралелни подотчети
- Отключване на нови възможности
- Професионална поддръжка
- Запитване и отчитане
- Предлага подобрена функционалност
- Пълна поддръжка на метаданни по време на изпълнение от източници на данни
Pentaho BI пакет
Сега ще научим за пакета Pentaho BI в този урок на Pentaho:
Pentaho BI Suite включва следните компоненти:
Pentaho Reporting
Pentaho Reporting зависи от проекта JFreeReport. Помага ви да изпълните нуждите си от бизнес отчети. Този компонент също така предлага публикуване на отчети както по график, така и по заявка в популярни формати като XLS, PDF, TXT и HTML.
Анализ
Той предлага широка гама от анализи, широка гама от функции, включително изглед на обобщена таблица. Инструментът предоставя подобрени GUI функции (използвайки Flash или SVG), интегрирани модули за табло, портал и интеграция на работния процес.
Освен това Pentaho Spreadsheet Services позволява на потребителя да преглежда, завърта и използва диаграма от MS Excel.
Dashboards
Таблото за управление предлага отчети и анализи, които допринасят със съдържание към таблата за управление на Pentaho. Дизайнерът на таблото за самообслужване включва обширни вградени шаблони и оформление на таблото. Той позволява на бизнес потребителите да създават персонализирани табла за управление с малко обучение.
Data Mining
Инструмент за извличане на данни открива скрити модели и индикатори за бъдещо представяне. Той предлага най-изчерпателния набор от алгоритми за машинно обучение от проекта Weka, който включва групиране, дървета на решения, произволни гори, анализ на главните компоненти, невронни мрежи.
Тя ви позволява да преглеждате данни графично, да взаимодействате с тях програмно или да използвате множество източници на данни за отчети, допълнителен анализ и други процеси.
Pentaho Data Integration
Този компонент се използва за интегриране на данни, където и да съществува.
Богата библиотека за трансформации с над 150 готови обекта за картографиране.
Той поддържа широк набор от източници на данни, който включва повече от 30 платформи с отворен код и собствени бази данни, плоски файлове. Също така помага Анализ на големи данни с интегриране и управление на данни на Hadoop.
Кой използва Pentaho BI?
Pentaho BI е широко използван инструмент от софтуерни специалисти като:
- Софтуерни програми с отворен код
- Бизнес анализатор и изследовател
- Студенти
- Съветник по бизнес разузнаване
Как да инсталирате Pentaho в AWS
Следва стъпка по стъпка процес за инсталиране на Pentaho в AWS.
Стъпка 1) Щракнете върху Продължете, за да се абонирате
Отиди https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro и щракнете върху Продължи
Стъпка 2) Приемете Общите условия
На следващата страница приемете лицензионното споразумение
Стъпка 3) Щракнете върху Продължи към конфигурацията
Продължете към конфигуриране
Стъпка 4) Щракнете върху Продължи към стартиране
Запазете настройките по подразбиране и щракнете, за да стартирате
Стъпка 5) Изчакайте например 5 минути, за да стартирате
Проверете инструкциите за употреба и изчакайте
Стъпка 6) Вземете публичен IP
Копирайте публичния IP на инстанцията.
Стъпка 7) Използвайте публичния IP за влизане
Поставете публичния IP на екземпляра за достъп до Pentaho.
Предпоставка за Пентахо
- Хардуерни изисквания
- Софтуерни изисквания
- Изтегляне и инсталиране на Bl suite
- Стартиране на пакета Bl
- Администриране на пакет Bl
Изискване за хардуер
Софтуерът Pentaho Bl Suite няма никакви ограничения за корекции на компютър или мрежов хардуер, стига да отговаряте на минималните софтуерни изисквания. Инсталирането на този инструмент за бизнес разузнаване е лесно. Препоръчителен набор от системни спецификации обаче:
RAM | Минимум 2GB |
Място на твърдия диск | Минимум 1GB |
Процесор | Двуядрен EM64T или AMD64 |
Софтуерни изисквания
- Инсталиране на Sun JRE 5.0
- Средата може да бъде 32-битова или 64-битова
- Подкрепа Operating системи: Linux, Solaris, Windows, Mac
- Работна станция, която има модерен интерфейс на уеб браузър като Chrome, Internet Explorer, Firefox
За да стартирате Bl-сървър
- On Windows от самото начало щракнете върху бутона за стартиране на иконата на Bl сървър.
- В Linux OS изпълнете скрипта start-pentaho в /biserver-ce/directory
За да стартирате администраторския сървър
- On Windows от бутона за стартиране щракнете върху стартиране на корпоративния сървър на Bl.
- За Linux: отидете в командния прозорец и стартирайте стартиращия скрипт в /biserver-ce/administration-console/directory.
За да спрете администраторския сървър
- За да спрете сървъра в Windows, щракнете върху иконите за спиране на би-сървър.
- На Linux. Трябва да отидете на терминала и да отидете в инсталираната директория и да стартирате stop.bat
Административна конзола на Pentaho
Дизайнер на отчети
Това е усъвършенстван инструмент за създаване на отчети. Това е идеален инструмент за вас, ако искате да създадете пълен отчет за устройство с данни. Този инструмент предлага изобилие от гъвкавост и функционалност в сравнение с ad hoc възможностите за докладване на Pentaho User Console.
Дизайн Студио
Това е Eclipseбазиран инструмент. Позволява ви да редактирате ръчно отчет или анализ. Той се използва широко за добавяне на модификации към съществуващ отчет, които не могат да бъдат добавени с дизайнера на отчети.
Дизайнер на агрегиране
Този графичен инструмент ви позволява да подобрите ефективността на куб Мондриан.
Редактор на метаданни
Използва се за добавяне на персонализиран слой метаданни към всеки съществуващ източник на данни.
Pentaho Data Integration
Инструментът за извличане, трансформиране и зареждане (ETL) на Kettle, който позволява
Pentaho Tool срещу BI стек
Pentaho Tool | BI стек |
---|---|
Интегриране на данни (PDI) | ETL |
Предлага редактор на метаданни | Той осигурява управление на метаданни |
Пентахо BA | Анализи |
Дизайнер на отчети | Operaнационално отчитане |
Сайку | Ad-hoc докладване |
CDE | Dashboards |
Pentaho потребителска конзола (PUC) | Управление/Мониторинг |
Предимства на Pentaho
Сега в този урок за интегриране на данни на Pentaho ще научим за някои предимства на Pentaho Business Intelligence Tool:
- Pentaho BI е много интуитивен инструмент. С някои основни концепции можете да работите с него.
- Прост и лесен за използване инструмент за бизнес разузнаване
- Предлага широк набор от BI възможности, които включват отчитане, табло за управление, интерактивен анализ, интегриране на данни, извличане на данни и др.
- Предлага се с удобен за потребителя интерфейс и предоставя различни инструменти за извличане на данни от множество източници на данни
- Предлага един пакет за работа с данни
- Има издание на общността с много сътрудници заедно с изданието Enterprise.
- Възможността за работа в клъстера Hadoop
- JavaКодът на скрипта, написан в компонентите на стъпката, може да се използва повторно в други компоненти.
Недостатъци на Pentaho
Ето минусите/недостатъците на използването на инструмента Pentaho BI:
- Дизайнът на интерфейса може да е слаб и няма унифициран интерфейс за всички компоненти.
- Много по-бавно развитие на инструмента в сравнение с други BI инструменти.
- Pentaho Business analytics предлага ограничен брой компоненти.
- Слаба подкрепа от общността. Така че, ако не получите работещ компонент, трябва да изчакате, докато бъде пусната следващата версия.
Oбобщение
- Pentaho е инструмент за бизнес разузнаване, който предоставя широка гама от бизнес разузнаване решения за клиентите
- Той предлага ETL възможности за нуждите на бизнес разузнаването.
- Пакетите на Pentaho предлагат компоненти като отчет, анализ, табло за управление и извличане на данни
- Pentaho Business Intelligence се използва широко от 1) Бизнес анализатор 2) Програмисти на софтуер с отворен код 3) Изследовател и 4) Студенти.
- Процесът на инсталиране на Pentaho включва: 1) Хардуерни изисквания 2) Софтуерни изисквания, 3) Изтегляне на Bl пакета, 4) Стартиране на Bl пакета и 5) Администриране на Bl пакета
- Важни компоненти на конзолата за администриране на Pentaho са 1) Дизайнер на отчети, 2) Дизайн студио, 3) Дизайнер на агрегиране 4) Редактор на метаданни 5) Интегриране на данни на Pentaho
- Pentaho е инструмент за интегриране на данни (PDI), докато BI стекът е ETL инструмент.
- Най-голямото предимство на Pentaho е, че е прост и лесен за използване инструмент за бизнес разузнаване.
- Основният недостатък на Pentaho е, че това е много по-бавно развитие на инструмента в сравнение с други BI инструменти