O que é Star Schema na modelagem de Data Warehouse?

O que é um Esquema Estelar?

Esquema Star no data warehouse, é um esquema no qual o centro da estrela pode ter uma tabela de fatos e várias tabelas de dimensões associadas. É conhecido como esquema em estrela porque sua estrutura se assemelha a uma estrela. O modelo de dados Star Schema é o tipo mais simples de esquema de Data Warehouse. Também é conhecido como Star Join Schema e é otimizado para consultar grandes conjuntos de dados.

O que é esquema multidimensional?

Esquema Multidimensional foi especialmente projetado para modelar sistemas de data warehouse. Os esquemas são projetados para atender às necessidades exclusivas de bancos de dados muito grandes projetados para fins analíticos (OLAP).

Tipos de esquema de data warehouse:

A seguir estão três tipos principais de esquemas multidimensionais, cada um com suas vantagens exclusivas.

Exemplo de modelagem de dados de esquema em estrela

No exemplo de esquema em estrela a seguir, a tabela de fatos está no centro e contém chaves para cada tabela de dimensão, como Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID e outros atributos como unidades vendidas e receita.

Modelagem de dados em esquema estrela
Exemplo de diagrama de esquema em estrela

Tabelas de fatos

Uma tabela de fatos em um esquema em estrela contém fatos e está conectada a dimensões. Uma tabela de fatos possui dois tipos de colunas:

  • Uma coluna que inclui fatos
  • Tabela de chave estrangeira para dimensões

Geralmente, a chave primária de uma tabela de fatos é uma chave composta composta por todas as chaves estrangeiras que compõem a tabela.

As tabelas de fatos podem conter fatos em nível de detalhe ou fatos agregados. As tabelas de fatos que incluem fatos agregados costumam ser chamadas de tabelas de resumo. As tabelas de fatos geralmente contêm fatos que foram agregados em algum nível.

Tabelas Dimensionais

Uma dimensão é uma arquitetura que categoriza dados em uma hierarquia. Uma dimensão sem hierarquias e níveis é chamada de dimensão plana ou lista. A chave primária de cada tabela de dimensão faz parte da chave primária composta da tabela de fatos. Um atributo de dimensão é um atributo textual descritivo que ajuda a descrever um valor dimensional. As tabelas de fatos geralmente são maiores que as tabelas de dimensões.

Características do esquema estelar

  • Cada dimensão em um esquema em estrela é representada com a única tabela unidimensional.
  • A tabela de dimensões deve conter o conjunto de atributos.
  • A tabela de dimensões é unida à tabela de fatos usando uma chave estrangeira
  • A tabela de dimensões não está unida entre si
  • A tabela de fatos conteria chave e medida
  • O esquema Star é fácil de entender e fornece uso ideal do disco.
  • As tabelas de dimensões não são normalizadas. Por exemplo, na figura acima, Country_ID não possui uma tabela de pesquisa de país como um design OLTP teria.
  • O esquema é amplamente suportado por ferramentas de BI

Vantagens do esquema estrela

  • Os esquemas em estrela têm uma lógica de junção mais direta em comparação com outros esquemas para buscar dados de esquemas transacionais altamente normalizados.
  • Ao contrário dos esquemas transacionais altamente normalizados, o esquema em estrela simplifica a lógica comum de relatórios de negócios, como relatórios e período a período.
  • Os esquemas em estrela são amplamente utilizados pelos sistemas OLAP para projetar cubos com eficiência. Um esquema em estrela pode ser usado como fonte sem projetar uma estrutura de cubo na maioria dos principais sistemas OLAP.
  • Ao permitir esquemas de desempenho específicos que podem ser aplicados a consultas, o software processador de consultas no Star Schema pode oferecer melhores planos de execução.

Desvantagem do esquema estrela

  • Como o esquema é altamente desnormalizado, a integridade dos dados não é bem aplicada.
  • Não é flexível em termos de necessidades analíticas.
  • Os esquemas em estrela não reforçam relacionamentos muitos-para-muitos dentro de entidades empresariais.