Estrategia de IA y MLOps
El foco está en pasar de notebooks a IA lista para producción, con énfasis en la operacionalización de LLMs, agentes multi-actor y la automatización del ciclo de vida de ML.
Asistentes de Programación con IA
| Herramienta | Contexto |
|---|---|
| Aider | Pair programmer terminal-native; minimalista y muy bien integrado con git. |
| Cursor | Editor IDE de referencia; integración nativa con modelos frontera. |
| GitHub Copilot | Estándar de la industria para asistencia y completado de código interactivo. |
| GitHub Copilot CLI | Asistente nativo de terminal. Muy útil para explicar comandos shell y flujos git con rapidez. |
| Herramienta | Contexto |
|---|---|
| Antigravity CLI (agy) | CLI de desarrollo agéntica diseñada para programación en pareja autónoma y razonamiento a escala de repositorio. |
| Claude Code | CLI agéntica para refactors complejos y navegación autónoma del codebase. |
| Cline | Extensión open source para VS Code; agente autónomo con plan + act. |
| Codex (OpenAI) | Partner agéntico para tareas autónomas, refactors y code reviews. |
Frameworks de Agentes y Orquestación
| Herramienta | Motivo |
|---|---|
| AutoGen | Multi-agent framework de Microsoft con la adopción enterprise más alta. |
| LangChain | Framework base para desarrollar aplicaciones con LLMs. Ubicuo, aunque pesado. |
| Herramienta | Motivo |
|---|---|
| CrewAI | Framework de alto nivel para coordinar agentes autónomos orientados por roles. |
| DSPy | Nuevo paradigma: programar con prompts y optimizarlos algorítmicamente. |
| LangGraph | Orquestación con estado para construir workflows agénticos cíclicos y complejos. |
| LangServe | Publica runnables y chains de LangChain como APIs REST de forma automática. |
| OpenAI Agents SDK | SDK oficial que reemplaza al patrón Assistants para construir agentes con OpenAI. |
| Pydantic AI | Framework de agentes type-safe y model-agnostic con muy buena experiencia de desarrollo. |
| Smolagents | Agentes minimalistas code-first de Hugging Face; ascenso fuerte en adopción. |
| Herramienta | Motivo |
|---|---|
| Hermes Agent | Framework de Nous Research que destaca por sus bucles de aprendizaje autoevolutivos y runtime persistente. |
| Letta | Agentes con memoria persistente como ciudadano de primera clase (antes MemGPT). |
| OpenClaw | Gateway de agentes autónomos local-first y self-hosted que conecta LLMs a canales de mensajería con habilidades programadas. |
| ROMA | Framework meta-agente recursivo para tareas de largo horizonte que las descompone en árboles jerárquicos de subtareas. |
Foundation Models
Lista opinionada de familias de modelos frontera y open-weight de referencia. Esta sección envejece rápido y se revisa periódicamente.
| Modelo | Contexto |
|---|---|
| Claude (Opus / Sonnet / Haiku) | Frontera en razonamiento y coding agéntico; mi default para tareas complejas. |
| Gemini (Pro / Flash) | Multimodal y long-context; integración nativa en GCP/Vertex. |
| GPT (OpenAI) | Frontera generalista; estándar para apps cerradas sobre OpenAI. |
| Modelo | Contexto |
|---|---|
| DeepSeek | Modelos OSS de reasoning competitivos con la frontera cerrada; pesos abiertos. |
| Llama | Open-weight de referencia para self-hosting; familia con varios tamaños. |
| Mistral / Mixtral | Open-weight europeo con licencias usables; fuerte en multilingüe. |
| Modelo | Contexto |
|---|---|
| Hermes (NousResearch) | Fine-tunes open-weight de referencia para tool-use y escenarios sin guardarraíles del proveedor. |
| Qwen | Familia OSS de Alibaba con buen rendimiento en código y multilingüe. |
Inferencia y Serving
| Herramienta | Contexto |
|---|---|
| LiteLLM | I/O universal para LLMs. Invoca más de 100 modelos usando el formato OpenAI. |
| llama.cpp | Inferencia local universal; sustrato de Ollama y de muchos runtimes. |
| Ollama | Clave para benchmarking local, pruebas con privacidad y uso de LLMs en edge. |
| vLLM | Motor de serving para LLMs con alto throughput y uso eficiente de memoria. El estándar de producción. |
| Herramienta | Contexto |
|---|---|
| OpenRouter | Interfaz unificada para acceder a modelos top-tier con facturación consolidada. |
| SGLang | Motor de serving rival de vLLM; fuerte en structured output y throughput. |
| Herramienta | Contexto |
|---|---|
| TensorRT-LLM | Motor NVIDIA optimizado para GPU dedicado en producción enterprise. |
Evaluación y Observabilidad de LLMs
| Herramienta | Motivo |
|---|---|
| Langfuse | Plataforma open source de tracing y eval; alternativa self-hostable a LangSmith. |
| LangSmith | Observabilidad de primer nivel para apps con LLMs. Esencial para depurar chains y agentes. |
| Ragas | Desarrollo guiado por métricas. Esencial para cuantificar el rendimiento de RAG. |
| Herramienta | Motivo |
|---|---|
| Phoenix (Arize) | Observabilidad LLM open source con tracing OTel-nativo. |
| Promptfoo | Eval CLI estilo pytest para regresión y comparativa de prompts. |
| Herramienta | Motivo |
|---|---|
| AgentCompass | Framework de evaluación, monitoreo y diagnóstico diseñado específicamente para flujos de agentes autónomos en producción post-despliegue. |
Memoria y Protocolos
| Componente | Motivo |
|---|---|
| MCP (Model Context Protocol) | Estándar abierto de Anthropic adoptado también por OpenAI y Google. Protocolo central para tool-use e integraciones. |
| OWASP Top 10 for LLM | Estándar esencial de seguridad para prevenir inyección y fuga de datos en GenAI. |
MLOps y Tracking
| Herramienta | Motivo |
|---|---|
| DVC | Data Version Control. Esencial para versionar datasets y modelos junto al código. |
| MLflow | La plataforma más madura para tracking de experimentos y model registry. |
| Vertex AI Pipelines | Estándar enterprise para workflows de ML gestionados en GCP. |
RAG y Búsqueda Vectorial
| Componente | Contexto |
|---|---|
| Hugging Face Transformers | Librería fundamental para acceder a modelos preentrenados de última generación. |
| LlamaIndex | Mi framework preferido para ingestión compleja de datos y optimización de RAG. |
| pgvector | Extensión de PostgreSQL para embeddings; pragmatismo extremo cuando ya hay Postgres en stack. |
| Qdrant | Vector DB líder open source, escrita en Rust; alto rendimiento y filtros ricos. |
| Componente | Contexto |
|---|---|
| ChromaDB | Base de embeddings open source. Excelente para desarrollo local y testing. |
| Neo4j GraphRAG | Combina knowledge graphs con vector search para retrieval más contextual y fundamentado. |
| Pinecone | Base de datos vectorial gestionada; sigue siendo sólida pero Qdrant y pgvector la desplazan en muchos casos. |
| Weaviate | Alternativa con hybrid search (BM25 + vector) bien integrado. |
Patrones de Diseño en Ingeniería de IA y MLOps
| Patrón | Contexto |
|---|---|
| Tríada y Evaluación de RAG | Framework para medir Context Relevance, Groundedness y Answer Relevance con el fin de evitar alucinaciones. |
| Patrón de Outputs Estructurados | Obligar a los LLMs a retornar un JSON estricto que cumpla con un esquema (ej. Pydantic) para garantizar la estabilidad de la integración. |
| Patrón | Contexto |
|---|---|
| Patrón de Cache Semántico | Almacenar y recuperar respuestas de LLMs basándose en la similitud semántica de la consulta para reducir costos de API y latencia. |
| Workflows Multi-Agente con Estado | Orquestar sistemas complejos como grafos cíclicos (ej. LangGraph) donde los agentes tienen roles especializados. |