¿Qué es OLAP? Cubo, Analítico Operaciones en el almacén de datos
¿Qué es OLAP?
Procesamiento analítico en línea (OLAP) es una categoría de software que permite a los usuarios analizar información de múltiples sistemas de bases de datos al mismo tiempo. Es una tecnología que permite a los analistas extraer y ver datos comerciales desde diferentes puntos de vista.
Los analistas necesitan con frecuencia agrupar, agregar y unir datos. Estas operaciones OLAP en la minería de datos consumen muchos recursos. Con OLAP, los datos se pueden calcular y agregar previamente, lo que acelera el análisis.
Las bases de datos OLAP se dividen en uno o más cubos. Los cubos están diseñados de tal manera que la creación y visualización de informes resulta sencilla. OLAP significa procesamiento analítico en línea.
Cubo OLAP

En el centro del concepto OLAP se encuentra un cubo OLAP. El cubo OLAP es una estructura de datos optimizada para velocidades muy rápidas. análisis de los datos.
El cubo OLAP consta de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo OLAP también se llama hipercubo.
Por lo general, las operaciones y el análisis de datos se realizan mediante una hoja de cálculo sencilla, donde los valores de los datos se organizan en formato de filas y columnas. Esto es ideal para datos bidimensionales. Sin embargo, OLAP contiene datos multidimensionales, que generalmente se obtienen de una fuente diferente y no relacionada. El uso de una hoja de cálculo no es una opción óptima. El cubo puede almacenar y analizar datos multidimensionales de manera lógica y ordenada.
¿Cómo funciona?
Un almacén de datos extraería información de múltiples fuentes y formatos de datos, como archivos de texto, hojas de Excel, archivos multimedia, etc.
Los datos extraídos se limpian y transforman. Los datos se cargan en un servidor OLAP (o cubo OLAP) donde la información se calcula previamente con antelación para su posterior análisis.
Operaciones analíticas básicas de OLAP
Los cuatro tipos de operaciones analíticas OLAP son:
- Enrollar
- Profundizar
- Parte y pica
- Pivotar (rotar)
1) Enrollado:
El roll-up también se conoce como “consolidación” o “agregación”. La operación de roll-up se puede realizar de 2 maneras
- Reducir dimensiones
- Ascendiendo en la jerarquía de conceptos. La jerarquía de conceptos es un sistema de agrupación de cosas según su orden o nivel.
Considere el siguiente diagrama
- En este ejemplo, las ciudades Nueva Jersey y Lost Angles se acumularon en el país EE. UU.
- Las cifras de ventas de Nueva Jersey y Los Ángeles son 440 y 1560 respectivamente. Se convierten en 2000 después del resumen.
- En este proceso de agregación, la jerarquía de ubicación de los datos asciende de la ciudad al país.
- En el proceso de enrollado es necesario eliminar al menos una o más dimensiones. En este ejemplo, se elimina la dimensión Ciudades.
2) Profundización
En el desglose, los datos se fragmentan en partes más pequeñas. Es lo opuesto al proceso acumulativo. Se puede hacer a través de
- Bajando en la jerarquía de conceptos
- Aumentar una dimensión
Considere el diagrama de arriba
- El primer trimestre del año se desglosa hasta los meses de enero, febrero y marzo. Las ventas correspondientes también son registros.
- En este ejemplo, se agregan los meses de dimensión.
3) Rebanada:
Aquí, se selecciona una dimensión y se crea un nuevo subcubo.
El siguiente diagrama explica cómo se realiza la operación de corte:
- El tiempo de dimensión se divide con Q1 como filtro.
- Se crea un cubo nuevo por completo.
Dado:
Esta operación es similar a la de cortar. La diferencia en el caso de los dados es que se seleccionan dos o más dimensiones que dan como resultado la creación de un subcubo.
4) Pivote
En Pivot, gira los ejes de datos para proporcionar una presentación sustituta de los datos.
En el siguiente ejemplo, el pivote se basa en los tipos de elementos.
Tipos de sistemas OLAP
Estructura jerárquica de OLAP
Tipo de OLAP | Explicación |
---|---|
OLAP relacional (ROLAP): | ROLAP es un RDBMS extendido junto con mapeo de datos multidimensionales para realizar la operación relacional estándar. |
OLAP multidimensional (MOLAP) | MOLAP implementa la operación en datos multidimensionales. |
Procesamiento analítico en línea híbrido (HOLAP) | En el enfoque HOLAP, los totales agregados se almacenan en una base de datos multidimensional, mientras que los datos detallados se almacenan en la base de datos relacional. Esto ofrece tanto la eficiencia de los datos del modelo ROLAP como el rendimiento del modelo MOLAP. |
OLAP de escritorio (DOLAP) | En Desktop OLAP, un usuario descarga una parte de los datos de la base de datos localmente o en su escritorio y los analiza.
DOLAP es relativamente más barato de implementar ya que ofrece muy pocas funcionalidades en comparación con otros sistemas OLAP. |
Web OLAP (WOLAP) | Web OLAP es un sistema OLAP accesible a través del navegador web. WOLAP es una arquitectura de tres niveles. Consta de tres componentes: cliente, middleware y un servidor de base de datos. |
OLAP móvil: | Mobile OLAP ayuda a los usuarios a acceder y analizar datos OLAP utilizando sus dispositivos móviles |
OLAP espacial: | SOLAP se crea para facilitar la gestión de datos tanto espaciales como no espaciales en un sistema de Información Geográfica (SIG) |
ROLAP
ROLAP trabaja con datos que existen en una base de datos relacional. Los hechos y las tablas de dimensiones se almacenan como tablas relacionales. También permite el análisis multidimensional de datos y es el OLAP de más rápido crecimiento.
Ventajas del modelo ROLAP:
- Alta eficiencia de datos. Ofrece una alta eficiencia de datos porque el rendimiento de las consultas y el lenguaje de acceso están optimizados particularmente para el análisis de datos multidimensionales.
- Escalabilidad Este tipo de sistema OLAP ofrece escalabilidad para gestionar grandes volúmenes de datos, e incluso cuando los datos aumentan constantemente.
Desventajas del modelo ROLAP:
- Demanda de mayores recursos: ROLAP necesita una alta utilización de recursos humanos, software y hardware.
- Limitaciones de datos agregados. Uso de herramientas ROLAP SQL para todos los cálculos de datos agregados. Sin embargo, no existen límites establecidos para el manejo de cálculos.
- Rendimiento de consulta lento. El rendimiento de las consultas en este modelo es lento en comparación con MOLAP
MOLAP
MOLAP utiliza motores de almacenamiento multidimensionales basados en matrices para mostrar vistas multidimensionales de datos. Básicamente, utilizan un cubo OLAP.
Más información sobre MOLAP aquí
OLAP híbrido
OLAP híbrido es una mezcla de ROLAP y MOLAP. Ofrece cálculo rápido de MOLAP y mayor escalabilidad de ROLAP. HOLAP utiliza dos bases de datos.
- Los datos agregados o calculados se almacenan en un cubo OLAP multidimensional
- La información detallada se almacena en una base de datos relacional.
Beneficios de OLAP híbrido:
- Este tipo de OLAP ayuda a economizar espacio en disco y también permanece compacto, lo que ayuda a evitar problemas relacionados con la velocidad de acceso y la comodidad.
- Los HOLAP híbridos utilizan tecnología de cubo que permite un rendimiento más rápido para todo tipo de datos.
- ROLAP se actualizan instantáneamente y los usuarios de HOLAP tienen acceso a estos datos actualizados instantáneamente en tiempo real. MOLAP ofrece limpieza y conversión de datos, mejorando así la relevancia de los datos. Esto trae lo mejor de ambos mundos.
Desventajas del OLAP híbrido:
- Mayor nivel de complejidad: El principal inconveniente de los sistemas HOLAP es que admite herramientas y aplicaciones tanto ROLAP como MOLAP. Por tanto, es muy complicado.
- Posibles superposiciones: Hay mayores posibilidades de superposición, especialmente en sus funcionalidades.
Ventajas de OLAP
- OLAP es una plataforma para todo tipo de negocios que incluye planificación, elaboración de presupuestos, informes y análisis.
- La información y los cálculos son consistentes en un cubo OLAP. Este es un beneficio crucial.
- Cree y analice rápidamente escenarios tipo "¿Qué pasaría si?"
- Busque fácilmente en la base de datos OLAP términos amplios o específicos.
- OLAP proporciona los componentes básicos para herramientas de modelado de negocios, herramientas de minería de datos y herramientas de informes de rendimiento.
- Permite a los usuarios dividir y dividir datos de cubos mediante varias dimensiones, medidas y filtros.
- Es bueno para analizar series de tiempo.
- Encontrar algunos clústeres y valores atípicos es fácil con OLAP.
- Es un potente sistema de visualización de procesos analíticos en línea que proporciona tiempos de respuesta más rápidos.
Desventajas de OLAP
- OLAP requiere organizar los datos en un esquema de estrella o copo de nieve. Estos esquemas son complicados de implementar y administrar.
- No puede tener una gran cantidad de dimensiones en un solo cubo OLAP
- No se puede acceder a los datos transaccionales con el sistema OLAP.
- Cualquier modificación en un cubo OLAP necesita una actualización completa del cubo. Este es un proceso que requiere mucho tiempo.
Resumen
- OLAP en almacenamiento de datos es una tecnología que permite a los analistas extraer y ver datos comerciales desde diferentes puntos de vista.
- En el centro del concepto OLAP se encuentra un cubo OLAP.
- Varias aplicaciones comerciales y otras operaciones de datos requieren el uso de OLAP Cube.
- Existen cinco tipos principales de operaciones OLAP analíticas en el almacén de datos: 1) Acumulación 2) Desglose 3) Segmentación 4) Corte y 5) Pivote
- Tres tipos de sistemas OLAP ampliamente utilizados son MOLAP, ROLAP y OLAP híbrido.
- Desktop OLAP, Web OLAP y Mobile OLAP son otros tipos de sistemas OLAP.