Saltar a contenido

Estrategia de IA y MLOps

El foco está en pasar de notebooks a IA lista para producción, con énfasis en la operacionalización de LLMs, agentes multi-actor y la automatización del ciclo de vida de ML.

Asistentes de Programación con IA

Herramienta Contexto
Aider Pair programmer terminal-native; minimalista y muy bien integrado con git.
Cursor Editor IDE de referencia; integración nativa con modelos frontera.
GitHub Copilot Estándar de la industria para asistencia y completado de código interactivo.
GitHub Copilot CLI Asistente nativo de terminal. Muy útil para explicar comandos shell y flujos git con rapidez.
Herramienta Contexto
Antigravity CLI (agy) CLI de desarrollo agéntica diseñada para programación en pareja autónoma y razonamiento a escala de repositorio.
Claude Code CLI agéntica para refactors complejos y navegación autónoma del codebase.
Cline Extensión open source para VS Code; agente autónomo con plan + act.
Codex (OpenAI) Partner agéntico para tareas autónomas, refactors y code reviews.

Frameworks de Agentes y Orquestación

Herramienta Motivo
AutoGen Multi-agent framework de Microsoft con la adopción enterprise más alta.
LangChain Framework base para desarrollar aplicaciones con LLMs. Ubicuo, aunque pesado.
Herramienta Motivo
CrewAI Framework de alto nivel para coordinar agentes autónomos orientados por roles.
DSPy Nuevo paradigma: programar con prompts y optimizarlos algorítmicamente.
LangGraph Orquestación con estado para construir workflows agénticos cíclicos y complejos.
LangServe Publica runnables y chains de LangChain como APIs REST de forma automática.
OpenAI Agents SDK SDK oficial que reemplaza al patrón Assistants para construir agentes con OpenAI.
Pydantic AI Framework de agentes type-safe y model-agnostic con muy buena experiencia de desarrollo.
Smolagents Agentes minimalistas code-first de Hugging Face; ascenso fuerte en adopción.
Herramienta Motivo
Hermes Agent Framework de Nous Research que destaca por sus bucles de aprendizaje autoevolutivos y runtime persistente.
Letta Agentes con memoria persistente como ciudadano de primera clase (antes MemGPT).
OpenClaw Gateway de agentes autónomos local-first y self-hosted que conecta LLMs a canales de mensajería con habilidades programadas.
ROMA Framework meta-agente recursivo para tareas de largo horizonte que las descompone en árboles jerárquicos de subtareas.

Foundation Models

Lista opinionada de familias de modelos frontera y open-weight de referencia. Esta sección envejece rápido y se revisa periódicamente.

Modelo Contexto
Claude (Opus / Sonnet / Haiku) Frontera en razonamiento y coding agéntico; mi default para tareas complejas.
Gemini (Pro / Flash) Multimodal y long-context; integración nativa en GCP/Vertex.
GPT (OpenAI) Frontera generalista; estándar para apps cerradas sobre OpenAI.
Modelo Contexto
DeepSeek Modelos OSS de reasoning competitivos con la frontera cerrada; pesos abiertos.
Llama Open-weight de referencia para self-hosting; familia con varios tamaños.
Mistral / Mixtral Open-weight europeo con licencias usables; fuerte en multilingüe.
Modelo Contexto
Hermes (NousResearch) Fine-tunes open-weight de referencia para tool-use y escenarios sin guardarraíles del proveedor.
Qwen Familia OSS de Alibaba con buen rendimiento en código y multilingüe.

Inferencia y Serving

Herramienta Contexto
LiteLLM I/O universal para LLMs. Invoca más de 100 modelos usando el formato OpenAI.
llama.cpp Inferencia local universal; sustrato de Ollama y de muchos runtimes.
Ollama Clave para benchmarking local, pruebas con privacidad y uso de LLMs en edge.
vLLM Motor de serving para LLMs con alto throughput y uso eficiente de memoria. El estándar de producción.
Herramienta Contexto
OpenRouter Interfaz unificada para acceder a modelos top-tier con facturación consolidada.
SGLang Motor de serving rival de vLLM; fuerte en structured output y throughput.
Herramienta Contexto
TensorRT-LLM Motor NVIDIA optimizado para GPU dedicado en producción enterprise.

Evaluación y Observabilidad de LLMs

Herramienta Motivo
Langfuse Plataforma open source de tracing y eval; alternativa self-hostable a LangSmith.
LangSmith Observabilidad de primer nivel para apps con LLMs. Esencial para depurar chains y agentes.
Ragas Desarrollo guiado por métricas. Esencial para cuantificar el rendimiento de RAG.
Herramienta Motivo
Phoenix (Arize) Observabilidad LLM open source con tracing OTel-nativo.
Promptfoo Eval CLI estilo pytest para regresión y comparativa de prompts.
Herramienta Motivo
AgentCompass Framework de evaluación, monitoreo y diagnóstico diseñado específicamente para flujos de agentes autónomos en producción post-despliegue.

Memoria y Protocolos

Componente Motivo
MCP (Model Context Protocol) Estándar abierto de Anthropic adoptado también por OpenAI y Google. Protocolo central para tool-use e integraciones.
OWASP Top 10 for LLM Estándar esencial de seguridad para prevenir inyección y fuga de datos en GenAI.
Componente Motivo
Mem0 Capa de memoria para IA personalizada. Permite retención de contexto a largo plazo.
Zep Memory layer para chat con retrieval temporal y extracción de entidades.

MLOps y Tracking

Herramienta Motivo
DVC Data Version Control. Esencial para versionar datasets y modelos junto al código.
MLflow La plataforma más madura para tracking de experimentos y model registry.
Vertex AI Pipelines Estándar enterprise para workflows de ML gestionados en GCP.

RAG y Búsqueda Vectorial

Componente Contexto
Hugging Face Transformers Librería fundamental para acceder a modelos preentrenados de última generación.
LlamaIndex Mi framework preferido para ingestión compleja de datos y optimización de RAG.
pgvector Extensión de PostgreSQL para embeddings; pragmatismo extremo cuando ya hay Postgres en stack.
Qdrant Vector DB líder open source, escrita en Rust; alto rendimiento y filtros ricos.
Componente Contexto
ChromaDB Base de embeddings open source. Excelente para desarrollo local y testing.
Neo4j GraphRAG Combina knowledge graphs con vector search para retrieval más contextual y fundamentado.
Pinecone Base de datos vectorial gestionada; sigue siendo sólida pero Qdrant y pgvector la desplazan en muchos casos.
Weaviate Alternativa con hybrid search (BM25 + vector) bien integrado.

Patrones de Diseño en Ingeniería de IA y MLOps

Patrón Contexto
Tríada y Evaluación de RAG Framework para medir Context Relevance, Groundedness y Answer Relevance con el fin de evitar alucinaciones.
Patrón de Outputs Estructurados Obligar a los LLMs a retornar un JSON estricto que cumpla con un esquema (ej. Pydantic) para garantizar la estabilidad de la integración.
Patrón Contexto
Patrón de Cache Semántico Almacenar y recuperar respuestas de LLMs basándose en la similitud semántica de la consulta para reducir costos de API y latencia.
Workflows Multi-Agente con Estado Orquestar sistemas complejos como grafos cíclicos (ej. LangGraph) donde los agentes tienen roles especializados.