Saltar al contenido
Nm NoumorDevs

Práctica · 05

Workflows de IA: del prompt al sistema multi-agente

No todo problema necesita un agente, y no todo agente necesita ser autónomo. Conocer el espectro — prompt, chain, tool use, RAG, agente, multi-agente, MCP — permite elegir la mínima complejidad suficiente.

Escalera

Los cinco niveles de sofisticación

  1. 1

    Prompt simple

    prompt

    Una sola llamada al modelo con instrucciones y contexto estático.

    Bueno para

    • resúmenes
    • reformulación
    • clasificación binaria

    Riesgos

    • Poca controlabilidad
    • No escala a tareas compuestas

    Ejemplo

    Clasificar un ticket por tipo a partir de su descripción.

  2. 2

    Chain determinista

    chain

    Varias llamadas encadenadas donde la salida de una alimenta a la siguiente, sin decisiones del modelo sobre el flujo.

    Bueno para

    • pipelines de transformación
    • ETL asistido
    • extracción + normalización

    Riesgos

    • Propagación de errores
    • Difícil de depurar sin trazas

    Ejemplo

    Extraer entidades → normalizar → clasificar → guardar.

  3. 3

    Tool use

    tool-use

    El modelo decide invocar funciones con contrato tipado. Suele ser el primer paso hacia "agente".

    Bueno para

    • consultas sobre datos
    • acciones acotadas
    • asistentes de producto

    Riesgos

    • Herramientas mal definidas = errores en cadena
    • Coste por reintentos

    Ejemplo

    Asistente que consulta stock y emite pedido vía funciones internas.

  4. 3

    Retrieval-Augmented Generation

    rag

    Recuperar contexto relevante antes de generar. Reduce alucinación y permite citar.

    Bueno para

    • soporte técnico
    • documentación
    • Q&A sobre dominio

    Riesgos

    • Chunks mal troceados
    • Sin reranker pierdes precisión

    Ejemplo

    Buscar en la base documental y responder con citas verificables.

  5. 4

    Agente

    agent

    Un bucle donde el modelo planifica, invoca herramientas y evalúa progreso hasta cumplir el objetivo.

    Bueno para

    • tareas exploratorias
    • ingeniería asistida
    • automatizaciones complejas

    Riesgos

    • Coste impredecible
    • Deriva del objetivo sin rúbrica
    • Guardrails débiles

    Ejemplo

    Agente de ingeniería que resuelve una issue: lee, edita, testea, abre PR.

  6. 5

    Multi-agente

    multi-agent

    Varios agentes especializados coordinados por un supervisor o por eventos. Alto poder, alta complejidad.

    Bueno para

    • pipelines de investigación
    • refactors profundos
    • análisis distribuido

    Riesgos

    • Sobreingeniería frecuente
    • Observabilidad difícil
    • Costes muy altos si no hay límites

    Ejemplo

    Supervisor + {Planner, Coder, Reviewer, QA} para entregar una feature completa.

  7. 4

    Model Context Protocol (MCP)

    mcp

    Protocolo estándar para exponer recursos, prompts y herramientas a modelos sin acoplarlos al cliente.

    Bueno para

    • contexto vivo
    • catálogos compartidos
    • gobernanza de herramientas

    Riesgos

    • Requiere servidores propios
    • Permisos finos imprescindibles

    Ejemplo

    Servidor MCP `nm://models` que alimenta esta web y otros clientes.

Cuándo usar agentes

El umbral de decisión

Antes de montar un agente, responde con honestidad: ¿el problema requiere realmente planificación iterativa o basta con un flujo determinista? Muchas soluciones agénticas desaparecen al sustituirlas por una chain bien pensada.

Usa agentes cuando el espacio de acciones es grande, el orden no es conocido de antemano y hay un criterio claro de éxito. Evítalos cuando no puedes definir una rúbrica: sin rúbrica, el agente no converge; parece que trabaja, pero no avanza.

La complejidad multi-agente solo se justifica cuando la especialización real aporta: una división sin valor añade coste y fragilidad.

Contrato mínimo para un agente gobernabletypescript
export interface AgentContract {
  readonly spec: SpecRef;          // qué hay que conseguir
  readonly rubric: Rubric;         // cómo se mide el éxito
  readonly tools: readonly Tool[]; // qué puede hacer
  readonly budget: {
    readonly maxSteps: number;
    readonly maxCostUsd: number;
    readonly maxLatencyMs: number;
  };
  readonly guards: {
    readonly allowNetwork: boolean;
    readonly writeScope: readonly string[];
  };
}

Gobernanza

Trazabilidad, validación y límites

Trazabilidad

Cada ejecución debe registrar prompt, contexto, herramientas invocadas, latencia y coste. Sin trazas, no hay mejora.

Validación continua

Eval automatizada con rúbrica, dataset dorado y regresión semántica en cada cambio de prompt o modelo.

Límites duros

Presupuesto por ejecución, whitelist de herramientas, circuit breaker por coste y validación de salida por esquema.

MCP

El protocolo que separa contexto de cliente

Model Context Protocol (MCP) estandariza cómo un cliente de IA accede a recursos, prompts y herramientas. En términos prácticos: deja de tener lógica de integración en cada app y la centraliza en servidores MCP reutilizables y auditables.

Para esta web, los catálogos de modelos, patrones y roles están diseñados para poder servirse desde un servidor MCP (nm://models, nm://roles…). El frontend consume un servicio (ContentService) que hoy lee TypeScript y mañana puede refrescar desde MCP sin tocar los componentes.