DataWarehouse vs. Data Mart: ¿cuál es mejor?

Contenido del Bootcamp Dirigido por: | Última modificación: 18 de abril de 2024 | Tiempo de Lectura: 3 minutos

Algunos de nuestros reconocimientos:

Premios KeepCoding

En este artículo, te hablaremos sobre DataWarehouse vs. Data Mart, ya que ambos son formas de almacenar datos que utilizan diferentes métodos para esta labor. Por eso, te explicamos cuáles son las ventajas de crear un DataWarehouse vs. Data Mart.

almacenamiento

DataWarehouse

Un DataWarehouse es una colección de datos orientados, integrados, no volátiles y variables en el tiempo que ayudan a la toma de decisiones de la entidad en la que se utilizan.

Dicho de otro modo, es una base de datos que se utiliza en BI, en la que se guarda absolutamente todo y en la que se procura que no haya islas de información. Es la base de datos core de las empresas y la más usada en analítica de datos. En Big Data, el DW se aloja dentro de un data lake.

Algunas de las cosas a tener en cuenta antes de crear un DataWarehouse vs. Data Mart son:

  • Es una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis.
  • No se debe comprar, se debe construir.
  • Funciona por implantación por fases.
  • Implica a varios departamentos de la empresa.
  • El diseño no es único ni estándar.
datawarehouse vs. data mart

Data Mart

Por su parte, un Data Mart es un subconjunto del Data Warehouse que proporciona una visualización personalizada. Es como un mini Data Warehouse en donde se mete solo la información necesaria.

Implementación DataWarehouse vs. Data Mart

Existen dos formas de implementar los DataWarehouse vs. Data Mart:

Top-down

¿Has escuchado hablar de los métodos inductivos y deductivos? El método deductivo consiste en ir de lo general a lo particular. Aunque esta frase puede empezar a sonarte como un cliché, fue el detective más famoso de las novelas policiacas, Sherlock Holmes, quien más lo popularizó. El método de Sherlock Holmes consistía en tomar la información que poseía y toda su experiencia y poner ambas cosas en práctica a la hora de resolver sus crímenes.

De este mismo modo funciona el top-down. Se crea primero el Data Warehouse y, luego, se crean y se montan los Data Mart dentro del DW general.

modelo top-down

Bottom-up

En esta forma sucede al contrario, a modo de método inductivo, se parte de lo particular y se llega a lo general. Así pues, se crean los Data Mart y, acto seguido, se montan en el Data Warehouse.

Este método suele ser más seguro y el mejor para proceder con los datos de una empresa, ya que consiste en crear el Data Mart de cada departamento de la empresa y, una vez que todos estos conjuntos se hayan montado, se aglutina todo en el almacén de datos denominado Data Warehouse.

Imagina que tienes la base de datos de una empresa. Una vez que se ha montado la base de datos y se han sacado informes para unas áreas y analítica para otras, llega algún miembro de determinada área a pedirte que le des acceso a tu base de datos. Como no puedes negarte, pero tampoco puedes dejar que esa persona maneje la base de datos a su antojo, le creas un Data Mart, el cual te permitirá poner dentro solo la información que esa persona necesita.

No obstante, aunque esta forma puede ser más práctica, ten en cuenta que también puede generar más islas de datos que la primera.

modelo bottom-up

Entonces, ¿cuál es mejor?

Como has podido observar, al plantearnos la dude de Datawarehouse vs. Data Mart, es difícil llegar a una conclusión absoluta. No se podría decir que uno es mejor que otro, ya que ambos se complementan.

Si quieres seguir haciendo un uso razonable de tus datos, te invitamos a realizar nuestro Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp, en donde aprenderás cómo hacerlo y podrás convertirte en un experto en el sector. ¡Anímate a apuntarte!

Posts más leídos

¡CONVOCATORIA ABIERTA!

Big Data, IA & Machine Learning

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado