O que é OLAP? Cubo, Analítico Operações em Data Warehouse
O que é OLAP?
Processamento analítico online (OLAP) é uma categoria de software que permite aos usuários analisar informações de vários sistemas de banco de dados ao mesmo tempo. É uma tecnologia que permite aos analistas extrair e visualizar dados de negócios sob diferentes pontos de vista.
Os analistas frequentemente precisam agrupar, agregar e unir dados. Essas operações OLAP na mineração de dados consomem muitos recursos. Com o OLAP os dados podem ser pré-calculados e pré-agregados, tornando a análise mais rápida.
Os bancos de dados OLAP são divididos em um ou mais cubos. Os cubos são projetados de forma que a criação e visualização de relatórios se tornem fáceis. OLAP significa Processamento Analítico Online.
cubo OLAP

No centro do conceito OLAP está um cubo OLAP. O cubo OLAP é uma estrutura de dados otimizada para análise de dados.
O Cubo OLAP consiste em fatos numéricos chamados medidas que são categorizados por dimensões. O Cubo OLAP também é chamado de hipercubo.
Normalmente, as operações e análises de dados são realizadas usando uma planilha simples, onde os valores dos dados são organizados em formato de linha e coluna. Isso é ideal para dados bidimensionais. No entanto, OLAP contém dados multidimensionais, geralmente obtidos de uma fonte diferente e não relacionada. Usar uma planilha não é a opção ideal. O cubo pode armazenar e analisar dados multidimensionais de maneira lógica e ordenada.
Como funciona?
Um data warehouse extrairia informações de múltiplas fontes e formatos de dados, como arquivos de texto, planilhas Excel, arquivos multimídia, etc.
Os dados extraídos são limpos e transformados. Os dados são carregados em um servidor OLAP (ou cubo OLAP) onde as informações são pré-calculadas antecipadamente para análise posterior.
Operações analíticas básicas de OLAP
Quatro tipos de operações analíticas OLAP são:
- Rolar
- Detalhamento
- Fatiar e cortar
- Girar (girar)
1) Acumulação:
Roll-up também é conhecido como “consolidação” ou “agregação”. A operação Roll-up pode ser realizada de 2 maneiras
- Reduzindo dimensões
- Subindo na hierarquia de conceitos. Hierarquia conceitual é um sistema de agrupamento de coisas com base em sua ordem ou nível.
Considere o seguinte diagrama
- Neste exemplo, as cidades Nova Jersey e Lost Angles são agrupadas no país EUA
- O número de vendas de Nova Jersey e Los Angeles é de 440 e 1560, respectivamente. Eles se tornam 2000 após o roll-up
- Neste processo de agregação, os dados são movidos pela hierarquia de localização da cidade para o país.
- No processo de roll-up, pelo menos uma ou mais dimensões precisam ser removidas. Neste exemplo, a dimensão Cidades foi removida.
2) Detalhamento
No detalhamento, os dados são fragmentados em partes menores. É o oposto do processo de rollup. Isso pode ser feito através
- Descendo na hierarquia de conceitos
- Aumentando uma dimensão
Considere o diagrama acima
- O primeiro trimestre é detalhado nos meses de janeiro, fevereiro e março. As vendas correspondentes também são registros.
- Neste exemplo, os meses de dimensão são adicionados.
3) Fatia:
Aqui, uma dimensão é selecionada e um novo subcubo é criado.
O diagrama a seguir explica como a operação de fatia foi executada:
- O tempo da dimensão é fatiado com Q1 como filtro.
- Um novo cubo é criado completamente.
ele diz:
Esta operação é semelhante a uma fatia. A diferença nos dados é que você seleciona 2 ou mais dimensões que resultam na criação de um subcubo.
4) Pivô
No Pivot, você gira os eixos de dados para fornecer uma apresentação substituta dos dados.
No exemplo a seguir, o pivô é baseado em tipos de itens.
Tipos de sistemas OLAP
Estrutura Hierárquica OLAP
Tipo de OLAP | Explicação |
---|---|
OLAP relacional (ROLAP): | ROLAP é um RDBMS estendido junto com mapeamento de dados multidimensional para realizar a operação relacional padrão. |
OLAP multidimensional (MOLAP) | MOLAP Implementa operação em dados multidimensionais. |
Processamento Analítico On-line Híbrido (HOLAP) | Na abordagem HOLAP, os totais agregados são armazenados em um banco de dados multidimensional, enquanto os dados detalhados são armazenados no banco de dados relacional. Isto oferece tanto a eficiência de dados do modelo ROLAP quanto o desempenho do modelo MOLAP. |
OLAP de área de trabalho (DOLAP) | No Desktop OLAP, um usuário baixa parte dos dados do banco de dados localmente ou em seu desktop e os analisa.
DOLAP é relativamente mais barato de implantar, pois oferece poucas funcionalidades em comparação com outros sistemas OLAP. |
OLAP da Web (WOLAP) | Web OLAP, que é um sistema OLAP acessível através do navegador da web. WOLAP é uma arquitetura de três camadas. Consiste em três componentes: cliente, middleware e servidor de banco de dados. |
OLAP móvel: | Mobile OLAP ajuda os usuários a acessar e analisar dados OLAP usando seus dispositivos móveis |
OLAP espacial: | SOLAP é criado para facilitar o gerenciamento de dados espaciais e não espaciais em um sistema de informação geográfica (GIS) |
ROLAP
ROLAP trabalha com dados que existem em um banco de dados relacional. As tabelas de fatos e dimensões são armazenadas como tabelas relacionais. Também permite análise multidimensional de dados e é o OLAP que mais cresce.
Vantagens do modelo ROLAP:
- Alta eficiência de dados. Oferece alta eficiência de dados porque o desempenho da consulta e a linguagem de acesso são otimizados especialmente para a análise de dados multidimensionais.
- Escalabilidade Este tipo de sistema OLAP oferece escalabilidade para gerenciar grandes volumes de dados, mesmo quando os dados aumentam constantemente.
Desvantagens do modelo ROLAP:
- Demanda por recursos maiores: ROLAP precisa de alta utilização de recursos humanos, software e hardware.
- Limitações de dados agregadas. Uso de ferramentas ROLAP SQL para todos os cálculos de dados agregados. No entanto, não há limites definidos para o tratamento de cálculos.
- Desempenho de consulta lento. O desempenho da consulta neste modelo é lento quando comparado com MOLAP
MOLAP
MOLAP usa mecanismos de armazenamento multidimensionais baseados em array para exibir visualizações multidimensionais de dados. Basicamente, eles usam um cubo OLAP.
Saiba mais sobre MOLAP aqui
OLAP híbrido
OLAP híbrido é uma mistura de ROLAP e MOLAP. Oferece cálculo rápido de MOLAP e maior escalabilidade de ROLAP. HOLAP usa dois bancos de dados.
- Os dados agregados ou computados são armazenados em um cubo OLAP multidimensional
- Informações detalhadas são armazenadas em um banco de dados relacional.
Benefícios do OLAP híbrido:
- Esse tipo de OLAP ajuda a economizar espaço em disco e também permanece compacto, o que ajuda a evitar problemas relacionados à velocidade e conveniência de acesso.
- O HOLAP híbrido utiliza tecnologia de cubo que permite desempenho mais rápido para todos os tipos de dados.
- Os ROLAP são atualizados instantaneamente e os usuários do HOLAP têm acesso a esses dados atualizados instantaneamente em tempo real. MOLAP traz limpeza e conversão de dados, melhorando assim a relevância dos dados. Isso traz o melhor dos dois mundos.
Desvantagens do OLAP híbrido:
- Maior nível de complexidade: A principal desvantagem dos sistemas HOLAP é que eles suportam ferramentas e aplicativos ROLAP e MOLAP. Assim, é muito complicado.
- Possíveis sobreposições: Há maiores chances de sobreposição, especialmente em suas funcionalidades.
Vantagens do OLAP
- OLAP é uma plataforma para todos os tipos de negócios, incluindo planejamento, orçamento, relatórios e análises.
- As informações e os cálculos são consistentes em um cubo OLAP. Este é um benefício crucial.
- Crie e analise rapidamente cenários “e se”
- Pesquise facilmente no banco de dados OLAP termos amplos ou específicos.
- OLAP fornece os blocos de construção para ferramentas de modelagem de negócios, ferramentas de mineração de dados e ferramentas de relatórios de desempenho.
- Permite que os usuários cortem e dividam dados de cubos por meio de várias dimensões, medidas e filtros.
- É bom para analisar séries temporais.
- Encontrar alguns clusters e valores discrepantes é fácil com OLAP.
- É um poderoso sistema de processo analítico on-line de visualização que fornece tempos de resposta mais rápidos
Desvantagens do OLAP
- OLAP requer a organização dos dados em um esquema estrela ou floco de neve. Esses esquemas são complicados de implementar e administrar
- Você não pode ter um grande número de dimensões em um único cubo OLAP
- Os dados transacionais não podem ser acessados com o sistema OLAP.
- Qualquer modificação em um cubo OLAP necessita de uma atualização completa do cubo. Este é um processo demorado
Resumo
- OLAP em data warehouse é uma tecnologia que permite aos analistas extrair e visualizar dados de negócios de diferentes pontos de vista.
- No centro do conceito OLAP está um cubo OLAP.
- Vários aplicativos de negócios e outras operações de dados exigem o uso do OLAP Cube.
- Existem cinco tipos principais de operações OLAP analíticas no data warehouse: 1) Roll-up 2) Drill-down 3) Fatia 4) Dados e 5) Pivô
- Três tipos de sistemas OLAP amplamente utilizados são MOLAP, ROLAP e Hybrid OLAP.
- Desktop OLAP, Web OLAP e Mobile OLAP são alguns outros tipos de sistemas OLAP.