Estrategia de IA y MLOps

El foco está en pasar de notebooks a IA lista para producción, con énfasis en la operacionalización de LLMs, agentes multi-actor y la automatización del ciclo de vida de ML.

Asistentes de Programación con IA

TRIALASSESS

Herramienta	Contexto
Aider	Pair programmer terminal-native; minimalista y muy bien integrado con git.
Cursor	Editor IDE de referencia; integración nativa con modelos frontera.
GitHub Copilot	Estándar de la industria para asistencia y completado de código interactivo.
GitHub Copilot CLI	Asistente nativo de terminal. Muy útil para explicar comandos shell y flujos git con rapidez.

Herramienta	Contexto
Antigravity CLI (agy)	CLI de desarrollo agéntica diseñada para programación en pareja autónoma y razonamiento a escala de repositorio.
Claude Code	CLI agéntica para refactors complejos y navegación autónoma del codebase.
Cline	Extensión open source para VS Code; agente autónomo con plan + act.
Codex (OpenAI)	Partner agéntico para tareas autónomas, refactors y code reviews.

Frameworks de Agentes y Orquestación

ADOPTTRIALASSESS

Herramienta	Motivo
AutoGen	Multi-agent framework de Microsoft con la adopción enterprise más alta.
LangChain	Framework base para desarrollar aplicaciones con LLMs. Ubicuo, aunque pesado.

Herramienta	Motivo
CrewAI	Framework de alto nivel para coordinar agentes autónomos orientados por roles.
DSPy	Nuevo paradigma: programar con prompts y optimizarlos algorítmicamente.
LangGraph	Orquestación con estado para construir workflows agénticos cíclicos y complejos.
LangServe	Publica runnables y chains de LangChain como APIs REST de forma automática.
OpenAI Agents SDK	SDK oficial que reemplaza al patrón Assistants para construir agentes con OpenAI.
Pydantic AI	Framework de agentes type-safe y model-agnostic con muy buena experiencia de desarrollo.
Smolagents	Agentes minimalistas code-first de Hugging Face; ascenso fuerte en adopción.

Herramienta	Motivo
Hermes Agent	Framework de Nous Research que destaca por sus bucles de aprendizaje autoevolutivos y runtime persistente.
Letta	Agentes con memoria persistente como ciudadano de primera clase (antes MemGPT).
OpenClaw	Gateway de agentes autónomos local-first y self-hosted que conecta LLMs a canales de mensajería con habilidades programadas.
ROMA	Framework meta-agente recursivo para tareas de largo horizonte que las descompone en árboles jerárquicos de subtareas.

Foundation Models

Lista opinionada de familias de modelos frontera y open-weight de referencia. Esta sección envejece rápido y se revisa periódicamente.

ADOPTTRIALASSESS

Modelo	Contexto
Claude (Opus / Sonnet / Haiku)	Frontera en razonamiento y coding agéntico; mi default para tareas complejas.
Gemini (Pro / Flash)	Multimodal y long-context; integración nativa en GCP/Vertex.
GPT (OpenAI)	Frontera generalista; estándar para apps cerradas sobre OpenAI.

Modelo	Contexto
DeepSeek	Modelos OSS de reasoning competitivos con la frontera cerrada; pesos abiertos.
Llama	Open-weight de referencia para self-hosting; familia con varios tamaños.
Mistral / Mixtral	Open-weight europeo con licencias usables; fuerte en multilingüe.

Modelo	Contexto
Hermes (NousResearch)	Fine-tunes open-weight de referencia para tool-use y escenarios sin guardarraíles del proveedor.
Qwen	Familia OSS de Alibaba con buen rendimiento en código y multilingüe.

Inferencia y Serving

ADOPTTRIALASSESS

Herramienta	Contexto
LiteLLM	I/O universal para LLMs. Invoca más de 100 modelos usando el formato OpenAI.
llama.cpp	Inferencia local universal; sustrato de Ollama y de muchos runtimes.
Ollama	Clave para benchmarking local, pruebas con privacidad y uso de LLMs en edge.
vLLM	Motor de serving para LLMs con alto throughput y uso eficiente de memoria. El estándar de producción.

Herramienta	Contexto
OpenRouter	Interfaz unificada para acceder a modelos top-tier con facturación consolidada.
SGLang	Motor de serving rival de vLLM; fuerte en structured output y throughput.

Herramienta	Contexto
TensorRT-LLM	Motor NVIDIA optimizado para GPU dedicado en producción enterprise.

Evaluación y Observabilidad de LLMs

ADOPTTRIALASSESS

Herramienta	Motivo
Langfuse	Plataforma open source de tracing y eval; alternativa self-hostable a LangSmith.
LangSmith	Observabilidad de primer nivel para apps con LLMs. Esencial para depurar chains y agentes.
Ragas	Desarrollo guiado por métricas. Esencial para cuantificar el rendimiento de RAG.

Herramienta	Motivo
Phoenix (Arize)	Observabilidad LLM open source con tracing OTel-nativo.
Promptfoo	Eval CLI estilo pytest para regresión y comparativa de prompts.

Herramienta	Motivo
AgentCompass	Framework de evaluación, monitoreo y diagnóstico diseñado específicamente para flujos de agentes autónomos en producción post-despliegue.

Memoria y Protocolos

ADOPTTRIAL

Componente	Motivo
MCP (Model Context Protocol)	Estándar abierto de Anthropic adoptado también por OpenAI y Google. Protocolo central para tool-use e integraciones.
OWASP Top 10 for LLM	Estándar esencial de seguridad para prevenir inyección y fuga de datos en GenAI.

Componente	Motivo
Mem0	Capa de memoria para IA personalizada. Permite retención de contexto a largo plazo.
Zep	Memory layer para chat con retrieval temporal y extracción de entidades.

MLOps y Tracking

ADOPT

Herramienta	Motivo
DVC	Data Version Control. Esencial para versionar datasets y modelos junto al código.
MLflow	La plataforma más madura para tracking de experimentos y model registry.
Vertex AI Pipelines	Estándar enterprise para workflows de ML gestionados en GCP.

RAG y Búsqueda Vectorial

ADOPTTRIAL

Componente	Contexto
Hugging Face Transformers	Librería fundamental para acceder a modelos preentrenados de última generación.
LlamaIndex	Mi framework preferido para ingestión compleja de datos y optimización de RAG.
pgvector	Extensión de PostgreSQL para embeddings; pragmatismo extremo cuando ya hay Postgres en stack.
Qdrant	Vector DB líder open source, escrita en Rust; alto rendimiento y filtros ricos.

Componente	Contexto
ChromaDB	Base de embeddings open source. Excelente para desarrollo local y testing.
Neo4j GraphRAG	Combina knowledge graphs con vector search para retrieval más contextual y fundamentado.
Pinecone	Base de datos vectorial gestionada; sigue siendo sólida pero Qdrant y pgvector la desplazan en muchos casos.
Weaviate	Alternativa con hybrid search (BM25 + vector) bien integrado.

Patrones de Diseño en Ingeniería de IA y MLOps

ADOPTTRIAL

Patrón	Contexto
Tríada y Evaluación de RAG	Framework para medir Context Relevance, Groundedness y Answer Relevance con el fin de evitar alucinaciones.
*Patrón de Outputs* Estructurados**	Obligar a los LLMs a retornar un JSON estricto que cumpla con un esquema (ej. Pydantic) para garantizar la estabilidad de la integración.

Patrón	Contexto
Patrón de Cache Semántico	Almacenar y recuperar respuestas de LLMs basándose en la similitud semántica de la consulta para reducir costos de API y latencia.
Workflows Multi-Agente con Estado	Orquestar sistemas complejos como grafos cíclicos (ej. LangGraph) donde los agentes tienen roles especializados.