¿Qué es Data Mart en Data Warehouse? Tipos y ejemplos
¿Qué es Data Mart?
A Data Mart se centra en un área funcional única de una organización y contiene un subconjunto de datos almacenados en un almacén de datos. Un Data Mart es una versión condensada de Data Warehouse y está diseñado para ser utilizado por un departamento, unidad o conjunto de usuarios específicos de una organización. Por ejemplo, marketing, ventas, recursos humanos o finanzas. A menudo está controlado por un solo departamento de una organización.
Data Mart generalmente extrae datos de solo unas pocas fuentes en comparación con un almacén de datos. Los data marts son de tamaño pequeño y más flexibles en comparación con un Datawarehouse.
¿Por qué necesitamos Data Mart?
- Data Mart ayuda a mejorar el tiempo de respuesta del usuario debido a la reducción del volumen de datos
- Proporciona fácil acceso a los datos solicitados con frecuencia.
- Los data mart son más sencillos de implementar en comparación con el datawarehouse corporativo. Al mismo tiempo, el costo de implementar Data Mart es ciertamente menor en comparación con la implementación de un almacén de datos completo.
- En comparación con el almacén de datos, un datamart es ágil. En caso de cambio de modelo, el datamart se puede construir más rápido debido a su menor tamaño.
- Un Datamart está definido por un único experto en la materia. Por el contrario, el almacén de datos está definido por PYME interdisciplinarias de una variedad de dominios. Por lo tanto, Data Mart está más abierto al cambio en comparación con Datawarehouse.
- Los datos están particionados y permiten privilegios de control de acceso muy granulares.
- Los datos se pueden segmentar y almacenar en diferentes plataformas de hardware/software.
Tipos de centro de datos
Hay tres tipos principales de data mart:
- DependienteLos data marts dependientes se crean extrayendo datos directamente de fuentes operativas, externas o ambas.
- Independiente: El data mart independiente se crea sin el uso de un almacén de datos central.
- Híbrido:Este tipo de data marts pueden tomar datos de almacenes de datos o de sistemas operativos.
Mercado de datos dependiente
Un data mart dependiente permite obtener los datos de la organización desde un único almacén de datos. Es uno de los ejemplos de data mart que ofrece el beneficio de la centralización. Si necesita desarrollar uno o más data marts físicos, debe configurarlos como data marts dependientes.
El Data Mart dependiente en el almacén de datos se puede construir de dos maneras diferentes. Ya sea donde un usuario puede acceder tanto al data mart como al almacén de datos, según la necesidad, o donde el acceso se limita únicamente al data mart. El segundo enfoque no es óptimo, ya que a veces produce lo que se denomina depósito de chatarra de datos. En el depósito de chatarra de datos, todos los datos comienzan con una fuente común, pero son desechados y en su mayoría desechados.

Mercado de datos independiente
Se crea un data mart independiente sin el uso de un almacén de datos central. Este tipo de Data Mart es una opción ideal para grupos más pequeños dentro de una organización.
Un data mart independiente no tiene relación con el data warehouse empresarial ni con ningún otro data mart. En el data mart independiente, los datos se ingresan por separado y sus análisis también se realizan de forma autónoma.
La implementación de mercados de datos independientes es la antítesis de la motivación para construir un almacén de datos. En primer lugar, necesita un almacén centralizado y coherente de datos empresariales que puedan ser analizados por múltiples usuarios con diferentes intereses que quieran información muy variada.

Mercado de datos híbrido
Un mercado de datos híbrido combina información de fuentes distintas del almacén de datos. Esto podría resultar útil cuando desee una integración ad hoc, como después de agregar un nuevo grupo o producto a la organización.
Es el mejor ejemplo de data mart adecuado para múltiples entornos de bases de datos y una rápida implementación para cualquier organización. También requiere un mínimo esfuerzo de limpieza de datos. Hybrid Data Mart también admite grandes estructuras de almacenamiento y es más adecuado para aplicaciones flexibles y centradas en datos más pequeñas.

Pasos para implementar un Datamart
Implementar un Data Mart es un proceso gratificante pero complejo. A continuación, se detallan los pasos para implementar un Data Mart:
Diseño
El diseño es la primera fase de la implementación de Data Mart. Cubre todas las tareas desde iniciar la solicitud de un data mart hasta recopilar información sobre los requisitos. Finalmente, creamos el diseño lógico y físico del Data Mart.
La etapa de diseño implica las siguientes tareas:
- Recopilar los requisitos comerciales y técnicos e identificar fuentes de datos.
- Seleccionar el subconjunto de datos apropiado.
- Diseño de la estructura lógica y física del data mart.
Los datos se pueden particionar según los siguientes criterios:
- Fecha
- Unidad de negocio o funcional
- Geografía
- Cualquier combinación de lo anterior
Los datos se pueden particionar a nivel de aplicación o DBMS. Aunque se recomienda realizar la partición a nivel de Aplicación, ya que permite diferentes modelos de datos cada año con el cambio en el entorno empresarial.
¿Qué productos y tecnologías necesita?
Bastaría con un simple lápiz y papel. Aunque las herramientas que te ayudan a crear UML o Diagrama ER También agregaría metadatos a sus diseños lógicos y físicos.
Construyendo
Esta es la segunda fase de implementación. Implica crear el base de datos física y las estructuras lógicas.
Este paso implica las siguientes tareas:
- Implementar la base de datos física diseñada en la fase anterior. Por ejemplo, se crean objetos de esquema de base de datos como tablas, índices, vistas, etc.
¿Qué productos y tecnologías necesita?
Tu necesitas un sistema de gestión de bases de datos relacionales para construir un mercado de datos. Los RDBMS tienen varias características necesarias para el éxito de un Data Mart.
- Administración de almacenamiento: Un RDBMS almacena y administra los datos para crear, agregar y eliminar datos.
- Acceso rápido a los datos: Con una consulta SQL puede acceder fácilmente a los datos en función de determinadas condiciones/filtros.
- Protección de Datos: El sistema RDBMS también ofrece una forma de recuperarse de fallas del sistema, como cortes de energía. También permite restaurar datos de estas copias de seguridad en caso de que falle el disco.
- Soporte multiusuario: El sistema de gestión de datos ofrece acceso simultáneo, la capacidad de que varios usuarios accedan y modifiquen los datos sin interferir ni sobrescribir los cambios realizados por otro usuario.
- Seguridad: El sistema RDMS también proporciona una forma de regular el acceso de los usuarios a los objetos y a ciertos tipos de operaciones.
Poblar
En la tercera fase, los datos se completan en el data mart.
El paso de rellenado implica las siguientes tareas:
- Mapeo de datos de origen a datos de destino
- Extracción de datos de origen.
- Operaciones de limpieza y transformación de los datos
- Cargando datos en el data mart
- Crear y almacenar metadatos
¿Qué productos y tecnologías necesita?
Estas tareas de población se llevan a cabo utilizando un Herramienta ETL (Extraer carga de transformación). Esta herramienta le permite observar las fuentes de datos, realizar un mapeo de origen a destino, extraer los datos, transformarlos, limpiarlos y volver a cargarlos en el centro de datos.
En el proceso, la herramienta también crea algunos metadatos relacionados con cuestiones como de dónde provienen los datos, qué tan recientes son, qué tipo de cambios se realizaron en los datos y qué nivel de resumen se realizó.
Accediendo
El acceso es un cuarto paso que implica utilizar los datos: consultarlos, crear informes, gráficos y publicarlos. El usuario final envía consultas a la base de datos y muestra los resultados de las consultas.
El paso de acceso debe realizar las siguientes tareas:
- Configure una metacapa que traduzca las estructuras de bases de datos y los nombres de objetos en términos comerciales. Esto ayuda a los usuarios no técnicos a acceder fácilmente al Data Mart.
- Configurar y mantener estructuras de bases de datos.
- Configure API e interfaces si es necesario
¿Qué productos y tecnologías necesita?
Puede acceder al data mart mediante la línea de comando o la GUI. Se prefiere la GUI, ya que puede generar gráficos fácilmente y es fácil de usar en comparación con la línea de comandos.
Gestionando
Este es el último paso del proceso de implementación de Data Mart. Este paso cubre tareas de gestión como:
- Gestión continua de acceso de usuarios.
- Optimizaciones y ajustes del sistema para lograr un rendimiento mejorado.
- Agregar y administrar datos nuevos en el data mart.
- Planificar escenarios de recuperación y garantizar la disponibilidad del sistema en caso de que el sistema falle.
¿Qué productos y tecnologías necesita?
Puede utilizar la GUI o la línea de comandos para la gestión del centro de datos.
Mejores prácticas para implementar Data Marts
A continuación se presentan las mejores prácticas que debe seguir durante el proceso de implementación de Data Mart:
- La fuente de un Data Mart debe estar estructurada por departamentos.
- El ciclo de implementación de un Data Mart debe medirse en períodos cortos de tiempo, es decir, en semanas en lugar de meses o años.
- Es importante involucrar a todas las partes interesadas en la fase de planificación y diseño, ya que la implementación del almacén de datos puede ser compleja.
- Los costos de hardware/software, redes e implementación de Data Mart deben presupuestarse con precisión en su plan.
- Aunque si el Data Mart se crea en el mismo hardware, es posible que necesiten algún software diferente para manejar las consultas de los usuarios. Se deben evaluar los requisitos adicionales de potencia de procesamiento y almacenamiento en disco para una respuesta rápida del usuario.
- Un centro de datos puede estar en una ubicación diferente al almacén de datos. Por eso es importante asegurarse de que tengan suficiente capacidad de red para manejar los volúmenes de datos necesarios para transferir datos al centro de datos..
- El costo de implementación debe incluir el tiempo que lleva el proceso de carga del Datamart. El tiempo de carga aumenta con el aumento de la complejidad de las transformaciones.
Ventajas y desventajas de un Data Mart
Ventajas
- Los mercados de datos contienen un subconjunto de datos de toda la organización. Estos datos son valiosos para un grupo específico de personas en una organización.
- Se trata de alternativas rentables a un almacenamiento de datos, cuya construcción puede implicar altos costos.
- Data Mart permite un acceso más rápido a los datos.
- Data Mart es fácil de usar ya que está diseñado específicamente para las necesidades de sus usuarios. Por tanto, un mercado de datos puede acelerar los procesos de negocio.
- Data Marts necesita menos tiempo de implementación en comparación con los sistemas de Data Warehouse. Es más rápido implementar Data Mart ya que solo necesita concentrar el único subconjunto de datos.
- Contiene datos históricos que permiten al analista determinar las tendencias de los datos.
Desventajas
- Muchas veces las empresas crean demasiados mercados de datos dispares y no relacionados sin muchos beneficios. Puede convertirse en un gran obstáculo de mantenimiento.
- Data Mart no puede ofrecer servicios a toda la empresa análisis de los datos ya que su conjunto de datos es limitado.
Resumen
- Definir Data Mart: Un Data Mart se define como un subconjunto de Data Warehouse que se centra en una única área funcional de una organización.
- Data Mart ayuda a mejorar el tiempo de respuesta del usuario debido a una reducción en el volumen de datos.
- Tres tipos de data mart son 1) Dependiente 2) Independiente 3) Híbrido
- Los pasos importantes de implementación de Data Mart son 1) Diseño 2) Construcción 3 Población 4) Acceso y 5) Gestión
- El ciclo de implementación de un Data Mart debe medirse en períodos cortos de tiempo, es decir, en semanas en lugar de meses o años.
- El data mart es una alternativa rentable a un almacén de datos, cuya construcción puede implicar altos costos.
- Data Mart no puede proporcionar análisis de datos de toda la empresa ya que el conjunto de datos es limitado.