¿Qué es el esquema en estrella en el modelado de almacén de datos?

¿Qué es un esquema de estrella?

Esquema de estrella En el almacén de datos, es un esquema en el que el centro de la estrella puede tener una tabla de hechos y varias tablas de dimensiones asociadas. Se le conoce como esquema estelar porque su estructura se asemeja a una estrella. El modelo de datos Star Schema es el tipo más simple de esquema de almacén de datos. También se conoce como Star Join Schema y está optimizado para consultar grandes conjuntos de datos.

¿Qué es el esquema multidimensional?

Esquema multidimensional está especialmente diseñado para modelar sistemas de almacenamiento de datos. Los esquemas están diseñados para abordar las necesidades únicas de bases de datos muy grandes diseñadas con fines analíticos (OLAP).

Tipos de esquema de almacén de datos:

A continuación se presentan tres tipos principales de esquemas multidimensionales, cada uno con sus ventajas únicas.

Ejemplo de modelado de datos de esquema en estrella

En el siguiente ejemplo de esquema en estrella, la tabla de hechos está en el centro y contiene claves para cada tabla de dimensiones como Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID y otros atributos como Unidades vendidas e ingresos.

Modelado de datos de esquema en estrella
Ejemplo de diagrama de esquema en estrella

Tablas de hechos

Una tabla de hechos en un esquema en estrella contiene hechos y está conectada a dimensiones. Una tabla de hechos tiene dos tipos de columnas:

  • Una columna que incluye hechos.
  • Tabla de clave externa para dimensiones

Generalmente, la clave primaria de una tabla de hechos es una clave compuesta que se compone de todas las claves externas que componen la tabla.

Las tablas de hechos pueden contener hechos a nivel de detalle o hechos agregados. Las tablas de hechos que incluyen hechos agregados suelen denominarse tablas de resumen. Las tablas de hechos suelen contener hechos que se han agregado hasta algún nivel.

Tablas de dimensiones

Una dimensión es una arquitectura que clasifica los datos en una jerarquía. Una dimensión sin jerarquías ni niveles se denomina dimensión plana o lista. La clave principal de cada tabla de dimensión forma parte de la clave principal compuesta de la tabla de hechos. Un atributo de dimensión es un atributo textual descriptivo que ayuda a describir un valor dimensional. Las tablas de hechos suelen ser más grandes que las tablas de dimensión.

Características del esquema de estrella

  • Cada dimensión en un esquema en estrella está representada con una única tabla unidimensional.
  • La tabla de dimensiones debe contener el conjunto de atributos.
  • La tabla de dimensiones se une a la tabla de hechos mediante una clave externa.
  • La tabla de dimensiones no está unida entre sí.
  • La tabla de hechos contendría clave y medida.
  • El esquema Star es fácil de entender y proporciona un uso óptimo del disco.
  • Las tablas de dimensiones no están normalizadas. Por ejemplo, en la figura anterior, Country_ID no tiene una tabla de búsqueda de países como la tendría un diseño OLTP.
  • El esquema es ampliamente compatible con herramientas de BI.

Ventajas del esquema en estrella

  • Los esquemas en estrella tienen una lógica de unión más sencilla en comparación con otros esquemas para recuperar datos de esquemas transaccionales altamente normalizados.
  • A diferencia de los esquemas transaccionales altamente normalizados, el esquema en estrella simplifica la lógica común de informes comerciales, como los informes y los períodos.
  • Los sistemas OLAP utilizan ampliamente los esquemas en estrella para diseñar cubos de manera eficiente. Se puede utilizar un esquema en estrella como fuente sin diseñar una estructura cúbica en la mayoría de los principales sistemas OLAP.
  • Al habilitar esquemas de rendimiento específicos que se pueden aplicar a las consultas, el software del procesador de consultas en Star Schema puede ofrecer mejores planes de ejecución.

Desventaja del esquema en estrella

  • Dado que el esquema está muy desnormalizado, la integridad de los datos no se aplica bien.
  • No es flexible en términos de necesidades analíticas.
  • Los esquemas en estrella no refuerzan las relaciones de muchos a muchos dentro de las entidades comerciales.