Tutorial de integración de datos de Pentaho: Qué es la herramienta ETL de Pentaho
¿Qué es Pentaho BI?
Pentaho es una herramienta de Business Intelligence que proporciona una amplia gama de soluciones de Business Intelligence a los clientes. Es capaz de generar informes, análisis de datos, integración de datos, extracción de datos, etc. Pentaho también ofrece un conjunto completo de funciones de BI que le permiten mejorar el rendimiento y la eficiencia del negocio.
Características de Pentaho
A continuación se presentan características importantes de Pentaho:
- Capacidades ETL para necesidades de inteligencia empresarial
- Comprensión del Diseñador de informes Pentaho
- Experiencia del producto
- Ofrece subinformes en paralelo
- Desbloquear nuevas capacidades
- Apoyo profesional
- Consulta e informes
- Ofrece funcionalidad mejorada
- Soporte completo de metadatos en tiempo de ejecución desde fuentes de datos
Suite Pentaho BI
Ahora, aprenderemos sobre la suite Pentaho BI en este tutorial de Pentaho:
Pentaho BI Suite incluye los siguientes componentes:
Informes de Pentaho
Pentaho Reporting depende del proyecto JFreeReport. Le ayuda a satisfacer sus necesidades de informes comerciales. Este componente también ofrece publicación de informes programada y bajo demanda en formatos populares como XLS, PDF, TXT y HTML.
Analisis
Ofrece una amplia gama de análisis y una amplia gama de características que incluyen una vista de tabla dinámica. La herramienta proporciona funciones GUI mejoradas (usando Flash o SVG), widgets de panel integrados, portal e integración de flujo de trabajo.
Además, Pentaho Spreadsheet Services permite al usuario explorar, girar y utilizar gráficos desde MS Excel.
Cuadros de mando
El panel ofrece informes y análisis, que aportan contenido a Pentaho Dashboards. El diseñador de paneles de autoservicio incluye amplias plantillas y diseños de paneles integrados. Permite a los usuarios empresariales crear paneles personalizados con poca formación.
Extracción de Información
Herramienta de minería de datos Descubre patrones ocultos e indicadores de rendimiento futuro. Ofrece el conjunto más completo de algoritmos de aprendizaje automático del proyecto Weka, que incluye agrupamiento, árboles de decisión, bosques aleatorios, análisis de componentes principales y redes neuronales.
Le permite ver datos gráficamente, interactuar con ellos mediante programación o utilizar múltiples fuentes de datos para informes, análisis adicionales y otros procesos.
Integración de datos de Pentaho
Este componente se utiliza para integrar datos dondequiera que existan.
Amplia biblioteca de transformación con más de 150 objetos de mapeo listos para usar.
Admite una amplia gama de fuentes de datos que incluyen más de 30 plataformas de bases de datos propietarias y de código abierto, y archivos planos. También ayuda Analítica de Big Data con integración y gestión de datos de Hadoop.
¿Quiénes utilizan Pentaho BI?
Pentaho BI es una herramienta ampliamente utilizada por muchos profesionales del software como:
- Programas de software de código abierto
- Analista e investigador de negocios
- Estudiantes universitarios
- concejal de inteligencia empresarial
Cómo instalar Pentaho en AWS
A continuación se muestra un proceso paso a paso sobre cómo instalar Pentaho en AWS.
Paso 1) Haga clic en Continuar para suscribirse
Vaya a https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro y haga clic en Continuar
Paso 2) Aceptar los términos y condiciones
En la página siguiente, acepte el acuerdo de licencia.
Paso 3) Haga clic en Continuar a la configuración
Continuar con la configuración
Paso 4) Haga clic en Continuar para iniciar
Mantenga la configuración predeterminada y haga clic para iniciar
Paso 5) Espere 5 minutos, por ejemplo, para iniciar
Consulta las instrucciones de uso y espera.
Paso 6) Obtener IP pública
Copie la IP pública de la instancia.
Paso 7) Utilice la IP pública para iniciar sesión
Pegue la IP pública de la instancia para acceder a Pentaho.
Requisito previo de Pentaho
- Requisitos de hardware
- Requisitos de Software
- Descargando e instalando Bl suite
- Iniciando la suite Bl
- Administración de la suite Bl
Requisito de hardware
El software Pentaho Bl Suite no tiene límites fijos en una computadora o hardware de red siempre que pueda cumplir con los requisitos mínimos de software. Es fácil instalar esta herramienta de inteligencia empresarial. Sin embargo, un conjunto recomendado de especificaciones del sistema:
RAM | Mínimo 2GB |
Espacio en el disco duro | Mínimo 1GB |
Procesador | EM64T de doble núcleo o AMD64 |
Requisitos de Software
- Instalación de Sun JRE 5.0
- El entorno puede ser de 32 o 64 bits.
- Soportado Operasistemas de instalación: Linux, Solaris, WindowsMac
- Una estación de trabajo que tenga una interfaz de navegador web moderna como Chrome, Internet Explorer, Firefox
Para iniciar el servidor Bl
- On Windows Desde el principio, haga clic en el botón Iniciar icono del servidor Bl.
- En el sistema operativo Linux, ejecute el script start-pentaho en /biserver-ce/directory
Para iniciar el servidor de administrador
- On Windows Desde el botón de inicio, haga clic en iniciar el servidor empresarial Bl.
- Para Linux: vaya a la ventana de comandos y ejecute el script de inicio en /biserver-ce/administration-console/directory.
Para detener el servidor de administrador
- Para detener el servidor en Windows, haga clic en los íconos de detener bi-servidor.
- En Linux. Debes ir a la terminal, ir al directorio instalado y ejecutar stop.bat.
Consola de administración Pentaho
Diseñador de informes
Es una herramienta avanzada de creación de informes. Esta es una herramienta ideal para usted si desea crear un informe completo de datos. Esta herramienta ofrece mucha flexibilidad y funcionalidad que las capacidades de informes ad hoc de la Consola de usuario de Pentaho.
Estudio de diseño
Es un Eclipse-herramienta basada en. Le permite editar manualmente un informe o análisis. Se usa ampliamente para agregar modificaciones a un informe existente que no se pueden agregar con Report Designer.
Diseñador de agregaciones
Esta herramienta gráfica le permite mejorar la eficiencia del cubo Mondrian.
Editor de metadatos
Se utiliza para agregar una capa de metadatos personalizada a cualquier fuente de datos existente.
Integración de datos de Pentaho
La herramienta de extracción, transformación y carga (ETL) de Kettle, que permite
Herramienta Pentaho frente a pila de BI
Herramienta Pentaho | Pila de BI |
---|---|
Integración de Datos (PDI) | ETL |
Ofrece editor de metadatos. | Proporciona gestión de metadatos. |
Pentaho BA | Analytics |
Diseñador de informes | OperaInformes nacionales |
saikú | Informes ad-hoc |
CDE | Cuadros de mando |
Consola de usuario Pentaho (PUC) | Gobernanza/Monitoreo |
Ventajas de Pentaho
Ahora, en este tutorial de integración de datos de Pentaho, conoceremos algunas ventajas de la herramienta Pentaho Business Intelligence:
- Pentaho BI es una herramienta muy intuitiva. Con algunos conceptos básicos se puede trabajar con ella.
- Herramienta de Business Intelligence sencilla y fácil de usar
- Ofrece una amplia gama de capacidades de BI que incluyen informes, paneles, análisis interactivos, integración de datos, minería de datos, etc.
- Viene con una interfaz fácil de usar y proporciona varias herramientas para recuperar datos de múltiples fuentes de datos.
- Ofrece paquete único para trabajar en Datos
- Tiene una edición comunitaria con muchos colaboradores junto con la edición Enterprise.
- La capacidad de ejecutarse en el clúster Hadoop
- JavaEl código de script escrito en los componentes de paso se puede reutilizar en otros componentes.
Desventajas de Pentaho
A continuación se detallan las desventajas y desventajas de utilizar la herramienta Pentaho BI:
- El diseño de la interfaz puede ser débil y no existe una interfaz unificada para todos los componentes.
- Evolución de herramientas mucho más lenta en comparación con otras herramientas de BI.
- Pentaho Business Analytics ofrece un número limitado de componentes.
- El soporte de la comunidad es deficiente. Por lo tanto, si no consigues un componente que funcione, tendrás que esperar hasta que se lance la próxima versión.
Resum
- Pentaho es una herramienta de Business Intelligence que proporciona una amplia gama de inteligencia empresarial soluciones a los clientes
- Ofrece capacidades ETL para necesidades de inteligencia empresarial.
- Las suites Pentaho ofrecen componentes como informes, análisis, paneles y minería de datos.
- Pentaho Business Intelligence es ampliamente utilizado por 1) analistas de negocios, 2) programadores de software de código abierto, 3) investigadores y 4) estudiantes universitarios.
- El proceso de instalación de Pentaho incluye: 1) Requisitos de hardware 2) Requisitos de software, 3) Descarga de Bl suite, 4) Inicio de Bl suite y 5) Administración de Bl suite
- Los componentes importantes de la consola de administración de Pentaho son 1) Diseñador de informes, 2) Estudio de diseño, 3) Diseñador de agregación 4) Editor de metadatos 5) Integración de datos de Pentaho
- Pentaho es una herramienta de integración de datos (PDI), mientras que BI stack es una Herramienta ETL.
- La mayor ventaja de Pentaho es que es una herramienta de Business Intelligence sencilla y fácil de usar.
- El principal inconveniente de Pentaho es que es una herramienta de evolución mucho más lenta en comparación con otras herramientas de BI.