Cuando comencé a trabajar con plataformas de datos en grandes proyectos, me encontré con la necesidad de elegir entre diferentes arquitecturas para organizar y gestionar la información. Dos enfoques que me llamaron mucho la atención por su popularidad y potencial fueron medallion architecture y data vault. Si estás iniciando en el mundo del data warehousing o quieres entender cuál se adapta mejor a tu negocio, este artículo te ofrecerá una guía clara, basada en mi experiencia directa y en las mejores prácticas actuales.
¿Qué es la Medallion Architecture?
La Medallion Architecture es una estrategia que organiza los datos en diferentes capas de calidad y refinamiento, habitualmente denominadas:
- Bronce Raw: datos en su estado original, sin procesar, con la máxima fidelidad respecto a la fuente.
- Plata Refined: datos ya limpiados, integrados y transformados, listos para análisis preliminares.
- Oro Curated: datos altamente refinados, optimizados para análisis avanzados o uso en aplicaciones críticas.
Esta arquitectura es muy popular en entornos de Data Lakes y Data Lakehouses, especialmente utilizando tecnologías como Databricks y Apache Spark. En mi última implementación para una empresa SaaS, utilizamos esta arquitectura para agilizar la ingesta y limpieza progresiva de los datos, lo que permitió a los equipos de análisis disponer de información casi en tiempo real, facilitando la toma de decisiones rápida y fundamentada.
Las ventajas principales que he identificado al usar Medallion Architecture son:
- Flexibilidad para integrar múltiples fuentes heterogéneas.
- Refinamiento progresivo que mejora la calidad sin pérdida de trazabilidad.
- Velocidad en pipeline gracias a procesos automatizados segmentados por capas.
¿Qué es Data Vault?

Por otro lado, Data Vault es un enfoque de modelado de datos que se centra en la auditoría, trazabilidad y flexibilidad para entornos altamente regulados y cambiantes. El modelo se basa en tres componentes principales:
- Hubs: representan las entidades clave del negocio (cliente, producto, etc.) con sus identificadores únicos.
- Links: son las relaciones entre las entidades, mapeando interacciones o asociaciones.
- Satellites: contienen atributos descriptivos y datos históricos vinculados a hubs o links.
En mi experiencia trabajando con instituciones financieras, Data Vault ha sido fundamental para cumplir con las estrictas normativas de gobierno y auditoría de datos. Su diseño facilita la captura de cambios históricos que son vitales para análisis regulatorios y reportes oficiales.
Beneficios clave de Data Vault:
- Modelado altamente normalizado que soporta cambios en negocio sin reestructurar el esquema.
- Historización completa que permite reconstruir el estado de los datos en cualquier punto del tiempo.
- Capacidad para auditar el origen y transformación de cada dato.
Medallion Architecture vs Data Vault: ¿En qué se diferencian?
Aspecto | Medallion Architecture | Data Vault |
---|---|---|
Modelo de datos | Capas de refinamiento progresivo (bronce, plata, oro). | Modelado basado en hubs, links y satellites (normalizado y auditable). |
Escenarios ideales | Proyectos con alta velocidad y diversidad de datos, enfocados en integración rápida y análisis casi en tiempo real. | Entornos empresariales con fuerte regulación y necesidad de trazabilidad histórica detallada. |
Gestión del cambio | Puede requerir ajustes en procesos ETL/ELT; enfoque flexible por capas. | Diseño modular facilita adaptación a cambios en entidades y relaciones sin romper el modelo. |
Auditoría y cumplimiento | Menos centrada en auditoría detallada, aunque se puede implementar. | Enfocada en auditar y validar cada dato, ideal para cumplimiento normativo. |
Complejidad y mantenimiento | Más sencillo de mantener en proyectos ágiles y modernos. | Puede ser más complejo, requiere equipos dedicados para gestión del modelo. |
Tecnologías asociadas | Databricks, Spark, Data Lakehouses. | Bases de datos relacionales, plataformas con enfoque en data warehousing tradicional. |
Casos prácticos: ¿Cuándo elegir uno u otro?
- Empresa SaaS con necesidad de análisis inmediato: Cuando trabajamos con un cliente SaaS que necesitaba visibilidad casi en tiempo real sobre el comportamiento de usuarios, optamos por Medallion Architecture. Nos permitió procesar grandes volúmenes de eventos y refinar datos rápidamente, adaptándonos a cambios constantes en las fuentes.
- Banco con fuertes regulaciones y requerimientos históricos: En un proyecto para una entidad financiera, la prioridad era mantener la trazabilidad minuciosa y el cumplimiento de normas. Implementamos Data Vault para asegurar que todo cambio estuviera registrado y auditado, lo que facilitó la aprobación de controles regulatorios y simplificó reportes.
Integración con tecnologías modernas y tendencias
- Data Lakehouses combinan lo mejor de data lakes y data warehouses, facilitando el uso de Medallion Architecture en plataformas como Databricks. Esto acelera pipelines ETL/ELT y soporta análisis avanzados y machine learning.
- Automatización y orquestación: Herramientas de workflow menos conocidas hace años ahora permiten mantener ambos modelos con menor esfuerzo manual, reduciendo errores y aumentando la eficiencia.
- Aspectos de gobernanza y seguridad: La integración con soluciones de protección de datos garantiza cumplimiento de GDPR, CCPA y otras normativas en ambas arquitecturas.
Conclusión
Si quieres profundizar en estas tecnologías y estar preparado para liderar esta transformación, te invito a conocer el Bootcamp Big Data, Data Science, ML & IA de KeepCoding.

Elegir entre Medallion Architecture y Data Vault no es cuestión de cuál es mejor en términos absolutos, sino cuál se adapta a las necesidades, regulaciones y velocidad del negocio.
- Opta por Medallion Architecture si necesitas flexibilidad, rapidez en la ingesta y procesamiento de datos variados, y análisis casi en tiempo real.
- Prefiere Data Vault cuando tu prioridad sea la auditoría, trazabilidad y cumplimiento normativo estricto en entornos donde cada cambio debe ser registrado con detalle.
Mi recomendación, basada en múltiples proyectos, es evaluar el contexto y peso del análisis histórico versus velocidad y flexibilidad operativa para tomar la mejor decisión.
Para profundizar, te recomiendo este recurso que te será de gran ayuda, la guía de Medallion Architecture en Databricks Medallion Architecture Overview.