Skip to main content

GPT-5.4 Mini/Nano: Los agentes ahora son más asequibles

Mar 22, 2026 6 min

LA GRAN HISTORIA

GPT-5.4 Mini/Nano: Los agentes ahora son más asequibles

Si has estado evitando los sistemas multiagente debido a los costes de las API, esta semana lo ha cambiado todo.

OpenAI dejó de usar GPT-5.4 mini y nano, versiones diseñadas específicamente para subagentes. La situación económica acaba de cambiar. Vamos a empezar.

El problema: Sistemas multiagente son caros

He aquí una realidad que la mayoría de los tutoriales no mencionan: los sistemas multiagente son caros.

¿Cada agente “supervisor” que genera agentes trabajadores? Eso implica varias llamadas a la API por tarea. Implementa un sistema de 5 agentes en GPT-4o y observa cómo se disparan tus costes.

He visto a desarrolladores abandonar proyectos de agentes por completo porque los cálculos no cuadraban.

Esta semana, OpenAI solucionó ese problema.

GPT-5.4 mini y nano son las variantes más pequeñas y rápidas, optimizadas específicamente para tareas de codificación y subagentes.

Esto es lo que importa:

  • Mini supera a GPT-5 mini en tareas de codificación, razonamiento y multimodales
  • Funciona 2 veces más rápido que los modelos anteriores de esta categoría
  • Una fracción del costo: diseñado para cargas de trabajo de agentes de alto volumen y baja latencia

El patrón que lo desbloquea:

Agente supervisor (GPT-5.4 o Claude Opus)

Agentes de trabajo (GPT-5.4 mini/nano)

Ejecución rápida y económica a gran escala

Utilice su costoso modelo para la planificación y la organización. Utilice mini/nano para las tareas más pesadas: operaciones con archivos, generación de código, llamadas a la API y procesamiento de datos.

Por qué esto te importa:

Si estás desarrollando aplicaciones de IA, los costes de los agentes se han reducido entre 5 y 10 veces en la capa de ejecución. Ese proyecto paralelo que era “demasiado caro de mantener” ahora podría ser viable.

En mi opinión: Los distintos niveles de modelos están convergiendo en un patrón: modelos caros para pensar, modelos baratos para actuar. Aprende a diseñar sistemas que aprovechen ambos.


ESTA SEMANA EN IA

Habilidades de OpenAI = Flujos de trabajo de agentes reutilizables

Junto con mini/nano, OpenAI anunció “Skills”: flujos de trabajo reutilizables y compartibles que ChatGPT puede aplicar automáticamente.

Piensa en esto: plantillas para patrones de agentes comunes que puedes agrupar y compartir. Esto demuestra la fuerte apuesta de OpenAI por los agentes como interfaz.


12,5 millones de dólares para defender el software de código abierto del spam de IA

La Fundación Linux anunció que Anthropic, AWS, GitHub, Google, Microsoft y OpenAI están reuniendo 12,5 millones de dólares.

¿La razón? La IA está generando tantos informes de seguridad falsos que los responsables del mantenimiento del software de código abierto no dan abasto.


Google Gemini se vuelve empresarial

Google integró Gemini en Hojas de cálculo (edición de hojas de cálculo en lenguaje natural, con un 70% de éxito en SpreadsheetBench) y Mapas (consultas conversacionales con navegación inmersiva en 3D).

Además: Google está proporcionando agentes de IA a los 3 millones de empleados del Pentágono para tareas no clasificadas. La IA empresarial avanza a pasos agigantados.


Antropología contra el Pentágono

Anthropic está luchando contra la designación de “riesgo para la cadena de suministro” por parte del gobierno estadounidense debido al uso militar de la IA. Empleados de Google y OpenAI respaldan públicamente a Anthropic.

Este caso definirá los límites de la IA en el gobierno. Merece la pena seguirlo de cerca.


HERRAMIENTA DE LA SEMANA

Zvec: SQLite para búsqueda vectorial

Si la infraestructura RAG ha sido un obstáculo para usted, esto cambia las cosas.

Zvec es la nueva base de datos vectorial integrada de Alibaba: se ejecuta en el mismo proceso que SQLite. Sin servidores. Sin Docker. Sin infraestructura.

Por qué es importante:

  • Más de 8000 consultas por segundo en pruebas de rendimiento (el doble de rápido que las alternativas en la nube)
  • Compatibilidad total con RAG: CRUD, búsqueda híbrida, reordenamiento integrado
  • Funciona sin conexión: perfecto para el desarrollo local y la implementación en el borde de la red
  • Licencia Apache 2.0: úsela comercialmente

Para proyectos de portafolio, esto es importantísimo. Puedes crear y mostrar aplicaciones RAG sin depender de la nube. Incluso puedes mostrar cómo se ejecutan en tu portátil durante una entrevista.

🔗 GitHub: github.com/alibaba/zvec

~Jaime