Saltar a contenido

Stack Tecnológico

Una selección estratégica de tecnologías y patrones arquitectónicos que uso para construir ecosistemas de datos, infraestructura cloud y plataformas de IA listas para producción.

Plataformas Cloud (enfocado en GCP)

  • Datos y analítica: BigQuery, BigLake, Dataflow, Dataproc, Cloud Storage.
  • IA y ML: Vertex AI (Model Garden, Pipelines, Feature Store), Gemini.
  • Compute y mensajería: Cloud Run, GKE, Pub/Sub, Cloud Functions.
  • Orquestación: Cloud Composer (Airflow), Cloud Workflows.

DevOps e Infraestructura (IaC)

  • Provisionamiento: Terraform (IaC modular), Terragrunt.
  • Contenedores: Docker, Kubernetes (GKE), Artifact Registry.
  • CI/CD: GitHub Actions, GitLab CI, Just, toolchain con uv.
  • Estándares: Conventional Commits, Semantic Versioning (SemVer), hooks de pre-commit.

Ingeniería de Datos y Orquestación

  • Herramientas: dbt (Core/Cloud), Apache Airflow, Dagster, Airbyte, Apache Hadoop.
  • Procesamiento: Apache Spark (PySpark/Scala), Databricks, Pandas, Polars.
  • Formatos de tabla: Apache Iceberg (principal), BigQuery Native, Delta Lake, Hudi.

IA en Producción y MLOps Aplicado

  • Frameworks: LangChain, LangGraph, Pydantic, FastAPI.
  • Patrones de IA: arquitecturas RAG, agentes de IA, Model Context Protocol (MCP), evaluación y gobierno de LLMs.

Lenguajes, Librerías y Formatos

  • Lenguajes: Python, SQL, Rust, Scala, Go, Shell Scripting (Bash).
  • Librerías: Pydantic, Pandas, Polars, Pytest, Poetry, uv.
  • Formatos de datos: Apache Parquet, Apache Avro, JSON / NDJSON.

Arquitectura y Confiabilidad

  • Patrones base: arquitecturas orientadas a eventos, batch/streaming híbrido (Kappa/Lambda), arquitectura Medallion (Bronze/Silver/Gold).
  • Estándares de ingeniería: contratos de datos, evolución de esquemas, idempotencia, deduplicación, quality gates y replayability.
  • Gobierno y ownership: Data Mesh (ownership por dominio), Data Vault 2.0, modelado Kimball.

Bases de Datos

  • Relacionales: PostgreSQL, MySQL, SQL Server, IBM DB2.
  • NoSQL y grafos: MongoDB, Neo4j.