Gobierno de Datos y Modelado
Estrategias técnicas para asegurar confianza, calidad y escalabilidad en los datos. El foco deja de ser solo "mover datos" para pasar a "gestionar datos como producto".
Arquitecturas de Modelado de Datos
| Patrón | Estado | Contexto |
|---|---|---|
| Medallion Architecture | ADOPT | El estándar de capas Bronze/Silver/Gold. Simple, efectivo y ampliamente entendido en entornos Lakehouse. |
| Anchor Modeling | ASSESS | Alternativa más liviana a Data Vault para auditabilidad e historización con menos sobrecarga. |
| Data Vault 2.0 | ASSESS | Lo evalúo para hubs empresariales complejos donde auditar y preservar histórico es crítico, pese a su complejidad. |
| Dimensional vs. 3NF | ASSESS | Guía explícita para decidir cuándo no usar Kimball y cuándo un modelo 3NF normalizado es más adecuado. |
| Kimball (Star Schema) | ADOPT | El gold standard para la capa de presentación y data marts con alto rendimiento BI. |
| Semantic / Metrics Layer | TRIAL | Unificar métricas de negocio en una capa reutilizable para reducir metric drift entre herramientas. |
| Event Modeling | ASSESS | Útil al diseñar pipelines orientados a eventos para mantener explícitos los flujos de comportamiento. |
Calidad y Validación
| Herramienta | Estado | Contexto |
|---|---|---|
| Great Expectations | ADOPT | Framework robusto para testear datos en la ingesta y forzar quality gates estrictos antes del procesamiento. |
| Soda | TRIAL | Monitoreo liviano y SQL-native de calidad de datos para detectar anomalías en el warehouse. |
| Data Contracts | ASSESS | Definir interfaces de datos como código para evitar que cambios rompan pipelines downstream. |
| Datahub | ASSESS | Plataforma open source de metadata para lineage y discovery end-to-end. |
| SQLMesh | ASSESS | Lo observo como posible sucesor de dbt para gestión de entornos más robusta y mejor entendimiento semántico. |
| OpenLineage | ASSESS | Estándar abierto para lineage entre orquestación, procesamiento y observabilidad. |
| Amundsen | ASSESS | Catálogo de datos open source centrado en discovery, ownership y búsqueda de metadata. |