Stack Tecnológico
Una selección estratégica de tecnologías y patrones arquitectónicos que uso para construir ecosistemas de datos, infraestructura cloud y plataformas de IA listas para producción.
Plataformas Cloud (enfocado en GCP)
- Datos y analítica: BigQuery, BigLake, Dataflow, Dataproc, Cloud Storage.
- IA y ML: Vertex AI (Model Garden, Pipelines, Feature Store), Gemini.
- Compute y mensajería: Cloud Run, GKE, Pub/Sub, Cloud Functions.
- Orquestación: Cloud Composer (Airflow), Cloud Workflows.
DevOps e Infraestructura (IaC)
- Provisionamiento: Terraform (IaC modular), Terragrunt.
- Contenedores: Docker, Kubernetes (GKE), Artifact Registry.
- CI/CD: GitHub Actions, GitLab CI, Just, toolchain con uv.
- Estándares: Conventional Commits, Semantic Versioning (SemVer), hooks de pre-commit.
Ingeniería de Datos y Orquestación
- Herramientas: dbt (Core/Cloud), Apache Airflow, Dagster, Airbyte, Apache Hadoop.
- Procesamiento: Apache Spark (PySpark/Scala), Databricks, Pandas, Polars.
- Formatos de tabla: Apache Iceberg (principal), BigQuery Native, Delta Lake, Hudi.
IA en Producción y MLOps Aplicado
- Frameworks: LangChain, LangGraph, Pydantic, FastAPI.
- Patrones de IA: arquitecturas RAG, agentes de IA, Model Context Protocol (MCP), evaluación y gobierno de LLMs.
Lenguajes, Librerías y Formatos
- Lenguajes: Python, SQL, Rust, Scala, Go, Shell Scripting (Bash).
- Librerías: Pydantic, Pandas, Polars, Pytest, Poetry, uv.
- Formatos de datos: Apache Parquet, Apache Avro, JSON / NDJSON.
Arquitectura y Confiabilidad
- Patrones base: arquitecturas orientadas a eventos, batch/streaming híbrido (Kappa/Lambda), arquitectura Medallion (Bronze/Silver/Gold).
- Estándares de ingeniería: contratos de datos, evolución de esquemas, idempotencia, deduplicación, quality gates y replayability.
- Gobierno y ownership: Data Mesh (ownership por dominio), Data Vault 2.0, modelado Kimball.
Bases de Datos
- Relacionales: PostgreSQL, MySQL, SQL Server, IBM DB2.
- NoSQL y grafos: MongoDB, Neo4j.