Medallion Architecture y Data Vault: Guía clave para data warehousing

| Última modificación: 25 de agosto de 2025 | Tiempo de Lectura: 4 minutos

Cuando comencé a trabajar con plataformas de datos en grandes proyectos, me encontré con la necesidad de elegir entre diferentes arquitecturas para organizar y gestionar la información. Dos enfoques que me llamaron mucho la atención por su popularidad y potencial fueron medallion architecture y data vault. Si estás iniciando en el mundo del data warehousing o quieres entender cuál se adapta mejor a tu negocio, este artículo te ofrecerá una guía clara, basada en mi experiencia directa y en las mejores prácticas actuales.

¿Qué es la Medallion Architecture?

La Medallion Architecture es una estrategia que organiza los datos en diferentes capas de calidad y refinamiento, habitualmente denominadas:

  • Bronce Raw: datos en su estado original, sin procesar, con la máxima fidelidad respecto a la fuente.
  • Plata Refined: datos ya limpiados, integrados y transformados, listos para análisis preliminares.
  • Oro Curated: datos altamente refinados, optimizados para análisis avanzados o uso en aplicaciones críticas.

Esta arquitectura es muy popular en entornos de Data Lakes y Data Lakehouses, especialmente utilizando tecnologías como Databricks y Apache Spark. En mi última implementación para una empresa SaaS, utilizamos esta arquitectura para agilizar la ingesta y limpieza progresiva de los datos, lo que permitió a los equipos de análisis disponer de información casi en tiempo real, facilitando la toma de decisiones rápida y fundamentada.

Las ventajas principales que he identificado al usar Medallion Architecture son:

  • Flexibilidad para integrar múltiples fuentes heterogéneas.
  • Refinamiento progresivo que mejora la calidad sin pérdida de trazabilidad.
  • Velocidad en pipeline gracias a procesos automatizados segmentados por capas.

¿Qué es Data Vault?

Medallion Architecture y Data Vault

Por otro lado, Data Vault es un enfoque de modelado de datos que se centra en la auditoría, trazabilidad y flexibilidad para entornos altamente regulados y cambiantes. El modelo se basa en tres componentes principales:

  • Hubs: representan las entidades clave del negocio (cliente, producto, etc.) con sus identificadores únicos.
  • Links: son las relaciones entre las entidades, mapeando interacciones o asociaciones.
  • Satellites: contienen atributos descriptivos y datos históricos vinculados a hubs o links.

En mi experiencia trabajando con instituciones financieras, Data Vault ha sido fundamental para cumplir con las estrictas normativas de gobierno y auditoría de datos. Su diseño facilita la captura de cambios históricos que son vitales para análisis regulatorios y reportes oficiales.

Beneficios clave de Data Vault:

  • Modelado altamente normalizado que soporta cambios en negocio sin reestructurar el esquema.
  • Historización completa que permite reconstruir el estado de los datos en cualquier punto del tiempo.
  • Capacidad para auditar el origen y transformación de cada dato.

Medallion Architecture vs Data Vault: ¿En qué se diferencian?

AspectoMedallion ArchitectureData Vault
Modelo de datosCapas de refinamiento progresivo (bronce, plata, oro).Modelado basado en hubs, links y satellites (normalizado y auditable).
Escenarios idealesProyectos con alta velocidad y diversidad de datos, enfocados en integración rápida y análisis casi en tiempo real.Entornos empresariales con fuerte regulación y necesidad de trazabilidad histórica detallada.
Gestión del cambioPuede requerir ajustes en procesos ETL/ELT; enfoque flexible por capas.Diseño modular facilita adaptación a cambios en entidades y relaciones sin romper el modelo.
Auditoría y cumplimientoMenos centrada en auditoría detallada, aunque se puede implementar.Enfocada en auditar y validar cada dato, ideal para cumplimiento normativo.
Complejidad y mantenimientoMás sencillo de mantener en proyectos ágiles y modernos.Puede ser más complejo, requiere equipos dedicados para gestión del modelo.
Tecnologías asociadasDatabricks, Spark, Data Lakehouses.Bases de datos relacionales, plataformas con enfoque en data warehousing tradicional.

Casos prácticos: ¿Cuándo elegir uno u otro?

  • Empresa SaaS con necesidad de análisis inmediato: Cuando trabajamos con un cliente SaaS que necesitaba visibilidad casi en tiempo real sobre el comportamiento de usuarios, optamos por Medallion Architecture. Nos permitió procesar grandes volúmenes de eventos y refinar datos rápidamente, adaptándonos a cambios constantes en las fuentes.
  • Banco con fuertes regulaciones y requerimientos históricos: En un proyecto para una entidad financiera, la prioridad era mantener la trazabilidad minuciosa y el cumplimiento de normas. Implementamos Data Vault para asegurar que todo cambio estuviera registrado y auditado, lo que facilitó la aprobación de controles regulatorios y simplificó reportes.

Integración con tecnologías modernas y tendencias

  • Data Lakehouses combinan lo mejor de data lakes y data warehouses, facilitando el uso de Medallion Architecture en plataformas como Databricks. Esto acelera pipelines ETL/ELT y soporta análisis avanzados y machine learning.
  • Automatización y orquestación: Herramientas de workflow menos conocidas hace años ahora permiten mantener ambos modelos con menor esfuerzo manual, reduciendo errores y aumentando la eficiencia.
  • Aspectos de gobernanza y seguridad: La integración con soluciones de protección de datos garantiza cumplimiento de GDPR, CCPA y otras normativas en ambas arquitecturas.

Conclusión

Si quieres profundizar en estas tecnologías y estar preparado para liderar esta transformación, te invito a conocer el Bootcamp Big Data, Data Science, ML & IA de KeepCoding.

bootcamp big data

Elegir entre Medallion Architecture y Data Vault no es cuestión de cuál es mejor en términos absolutos, sino cuál se adapta a las necesidades, regulaciones y velocidad del negocio.

  • Opta por Medallion Architecture si necesitas flexibilidad, rapidez en la ingesta y procesamiento de datos variados, y análisis casi en tiempo real.
  • Prefiere Data Vault cuando tu prioridad sea la auditoría, trazabilidad y cumplimiento normativo estricto en entornos donde cada cambio debe ser registrado con detalle.

Mi recomendación, basada en múltiples proyectos, es evaluar el contexto y peso del análisis histórico versus velocidad y flexibilidad operativa para tomar la mejor decisión.

Para profundizar, te recomiendo este recurso que te será de gran ayuda, la guía de Medallion Architecture en Databricks Medallion Architecture Overview.

¡CONVOCATORIA ABIERTA!

Big Data & Data Science

Full Stack Bootcamp

Clases en Directo | Acceso a +600 empresas | 98% de empleabilidad

KeepCoding Bootcamps
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.