Glosario de Data Warehouse: 7 conceptos fundamentales

Contenido del Bootcamp Dirigido por: | Última modificación: 26 de septiembre de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

Si has llegado a este post, has de tener curiosidad por el popular sistema de almacenaje de datos Data Warehouse. Es evidente que es un conocimiento base en el mundo IT, puesto que Data Warehouse ha demostrado prevalecer en el mundo de la programación por décadas.

Por ello, en este post te compartimos un glosario con siete de sus conceptos fundamentales.

ODS (Operational Data Store o Almacén Operacional de datos)

El almacén operacional de datos (Operational Data Store) es un contenedor de datos activos diseñado para integrar datos de múltiples fuentes.

De hecho, con una ventana de refresco pequeña o, incluso, en tiempo real, este almacén de datos guarda una copia de los datos de los sistema origen o fuentes, de manera que se utiliza como una capa intermedia para un Data Warehouse.

Staging Area

Staging Area es otro de los sistemas intermedios y componentes de un Data Warehouse. Este sistema tiene el objetivo de facilitar la extracción y la transformación de los datos.

Por otra parte, a diferencia del ODS (Operational Data Store), este sistema suele ser volátil y, normalmente, se borra una vez se ha hecho la carga de datos final en el DW (Data Warehouse) o tras una fase de validación.

Datamarts

Los Datamarts o Data Marts hacen referencia a los subconjuntos de datos de un DW (Data Warehouse). Por ejemplo, podrás contar con tipos de subconjuntos como Data Mart Contable o Data Mart Recibos, entre otros.

Metadatos

Entre los componentes de un Data Warehouse puedes encontrar los metados. Estos datos se definen comúnmente como “los datos acerca de los datos”El metadato documenta y responde a preguntas como las siguientes:

  • ¿Qué tablas existen en un DW (Data Warehouse)?
  • ¿Cuáles son las columnas que se utilizan y qué tipo de datos contienen?
  • ¿Cuáles son los procesos que explotan estas tablas y datos?
  • ¿En dónde se está visualizando dicha información?

Control de Cambios (CDC)

Un sistema de control de cambios o CDC se conoce como un conector que funciona directamente sobre el sistema de origen, de manera que puedes entregar los datos de una forma ágil y sencilla.

De hecho, podrás ahorrar mucho tiempo en la carga de los datos de los sistemas de información.

Dimensión tipo 0

También podrás contar con la dimensión tipo 0. Este tipo de dimensión se refiere a las tablas que tienen una carga completa; sin embargo, para ello, debes contar con un previo borrado de los datos.

Dimensión tipo 1

Por otra parte, la dimensión tipo 1 se forma con parte de las tablas que recogen los cambios. Por ejemplo, al insertar aquellos registros nuevos que no tendrás en el Data Warehouse.

Por otra parte, se van a ir actualizando de manera automática los registros que has cambiado o que ya existen.

Dimensión tipo 2

En suma, podrás contar con la dimensión tipo 2. Este tipo de dimensión se refiere a las tablas que recogen los cambios, de manera que inserta aquellos registros nuevos de los que no tienes en el Data Warehouse.

De esta forma, los datos van actualizando los registros que han cambiado o que ya existen. Por último, esta dimensión va “eliminando” aquellos registros que ya no existen en el Operacional, lo que te ahorra tiempo y esfuerzo en el procesamiento de los datos.

Aprende más sobre Big Data

En este post, te hemos introducido a siete de los conceptos que necesitas saber una vez te interesas por implementar un Data Warehouse en tu procesamiento de los macrodatos. Sin embargo, esta herramienta tan demandada requiere de muchos más conocimientos al respecto. ¡Anímate a aprender más sobre el Big Data!

Para continuar con tu formación, en KeepCoding te ofrecemos el Bootcamp Full Stack Big Data, Inteligencia Artificial & Machine Learning para que conozcas todos los fundamentos base de los sistemas, lenguajes y herramientas más empleados y demandados en el mundo Big Data. ¡No esperes más para apuntarte!

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado