Reseña práctica

FLUX en 2026: el modelo open-weights que sigue liderando

FLUX.1 [pro], [dev], [schnell] para generación, Kontext para edición en contexto. Una semana de pruebas, salidas reales y el veredicto.

Por el equipo de contenido de Vuela.ai ·

Intro oficial de Black Forest Labs.

Lo que clava

  • Pesos abiertos en [dev] y [schnell]
  • Mejor fotorrealismo de su clase en [pro]
  • Kontext junta edición prompt + imagen en una pasada
  • Disponible en casi todos los agregadores

Donde flaquea

  • Sin audio nativo, ni vídeo, ni herramientas de pipeline
  • [pro] solo accesible por API de pago
  • Renderizado denso de texto sigue por detrás de Ideogram y Nano Banana Pro
  • Auto-hospedar [dev] requiere presupuesto GPU significativo

FLUX es el modelo de imagen que la mayoría de modelos competidores usa como benchmark silencioso. El lanzamiento de 2024 de Black Forest Labs rompió el campo open-weights, y el lanzamiento de Kontext en 2025 añadió edición encima. En 2026, FLUX sigue en lo más alto del bracket de calidad pura de imagen, aunque Nano Banana Pro se lleva la corona orientada a edición y Midjourney v7 mantiene la corona estética.

Pasé una semana corriendo FLUX.1 [pro], [dev], [schnell] y Kontext por los trabajos que enviamos en Vuela: fotografía de producto, campañas de marca, ilustraciones hero. Abajo: para qué sirve cada capa, dónde FLUX sigue liderando y dónde le han comido terreno desde el lanzamiento.

¿Qué es FLUX (y qué es Kontext)?

FLUX es la familia texto-a-imagen de Black Forest Labs. El lanzamiento original de FLUX.1 en agosto de 2024 vino en tres capas: FLUX.1 [pro] (pesos cerrados, calidad top, solo API), FLUX.1 [dev] (pesos abiertos, calidad casi pro, no comercial) y FLUX.1 [schnell] (pesos abiertos, destilado para velocidad, Apache 2.0).

FLUX.1 Kontext, lanzado en mayo de 2025, añadió generación y edición en contexto: prompt con texto e imágenes a la vez, y el modelo edita dentro de ese contexto. Es la respuesta FLUX a la tendencia de edición conversacional que inició Nano Banana.

El acceso es amplio: bfl.ai para el playground oficial, Hugging Face para los pesos y casi todo agregador y plataforma de inferencia expone el modelo.

Cómo conseguí acceso

Usé el BFL Playground para generaciones [pro], endpoints de inferencia de Hugging Face para [dev] y una 4090 local para pruebas de [schnell]. Kontext lo corrí por la API oficial. Costes desde unos pocos céntimos por imagen en agregadores hasta cero en hardware local.

Los tres trabajos que probé

Mismos prompts en todas las capas de FLUX para comparar trade-offs.

  1. Hero de producto. Frasco de perfume sobre mármol con luz motivada de ventana. Comparativa: pro vs dev vs schnell.
  2. Retrato editorial. Un personaje con outfit complejo, profundidad de campo reducida, estilo revista.
  3. Cadena de edición con Kontext. Una foto inicial + tres ediciones de seguimiento usando FLUX.1 Kontext.

Los resultados de las pruebas

Prueba 1. Hero de producto

Prompt: “Frasco de perfume de cristal sobre una superficie de mármol Carrara pulido, luz suave direccional de ventana desde cámara izquierda, profundidad de campo reducida. Estilo campaña editorial. 8K.”

En [pro], el frasco tuvo brillos especulares nítidos, refracción de cristal precisa y una superficie de mármol que leía como Carrara real en vez de granito falso. En [dev], el resultado estaba a un 90% con algo menos de detalle en reflejos. En [schnell], la velocidad fue el titular (menos de dos segundos por render) a costa de textura notablemente más blanda. Para trabajo de cliente [pro] sigue siendo la respuesta; para iteración rápida [schnell] es genuinamente usable.

Prueba 2. Retrato editorial

Prompt: “Mujer joven con outfit en capas complejo, cara con pecas, bob recién cortado, mirando fuera de cámara, iluminación editorial de revista. Tirada en formato medio. 4K.”

Textura de piel y detalle de pelo es donde FLUX siempre ha liderado silenciosamente. [pro] mantuvo la posición de pecas, la dirección del pelo y la estratificación de la tela en un nivel que Midjourney v7 iguala estilísticamente pero supera en territorio pictórico. Para editorial realista, FLUX sigue ganando.

Prueba 3. Cadena de edición con Kontext

Prompt: “Inicio: una zapatilla en fondo blanco. Luego: «coloca la zapatilla en una playa al atardecer». Luego: «cambia los cordones a rojo». Luego: «añade motion blur como si la estuvieran lanzando».”

Kontext gestionó la cadena de forma limpia. La identidad de la zapatilla (silueta, pistas de marca) sobrevivió a las tres ediciones. El cambio de color de cordones se quedó local — el resto de la imagen no se movió. Frente a Nano Banana Pro en la misma cadena, Kontext es algo más fuerte en detalle fotográfico y algo más débil en edición conversacional basada en texto. Son complementarios, no competidores.

Las partes molestas

[pro] es cerrado. La mejor capa es solo por API. Para equipos que quieren auto-hospedar el modelo top, FLUX no es la respuesta.

[dev] es no comercial. La capa abierta más fuerte tiene licencia no comercial. El uso comercial necesita una licencia aparte o la API de [pro].

Sin pipeline. FLUX es un modelo, no una plataforma. Clonado, traducción, movimiento y pipelines de vídeo necesitan herramientas encima.

¿Vale la pena el precio?

Para agencias que necesitan la mejor calidad de imagen fotográfica, FLUX.1 [pro] sigue siendo el modelo al que ir primero. Para social a volumen o trabajo por lotes, [schnell] a coste por imagen casi cero es la decisión correcta.

Para desarrolladores integrando en producto, el precio por imagen en agregadores está en céntimos — predecible y fácil de presupuestar.

Cómo encaja Vuela.ai en un flujo con FLUX

FLUX es la espina dorsal de calidad de imagen de muchos pipelines de producción, incluido el que Vuela.ai expone a creadores. Donde termina FLUX, Vuela continúa: convertir una imagen generada con FLUX en un anuncio en vídeo, clonar un formato viral a su alrededor, traducir el activo final con lip-sync real entre idiomas.

Vuela.ai junta calidad de imagen tipo FLUX con vídeo, voz, clonador y traductor en un plan plano. Sin malabarear créditos BFL, cuotas Hugging Face y un proveedor de vídeo aparte.

Imágenes nivel FLUX dentro de un pipeline real

Vuela.ai te da calidad de imagen tipo FLUX más vídeo, voz, clonador y traductor en un plan plano.

El veredicto

FLUX es, en mayo de 2026, todavía la base texto-a-imagen más fuerte del mercado. Para generación fotográfica pura, [pro] lidera. Para flujos orientados a edición, Nano Banana Pro tiene ahora una respuesta competitiva con Kontext justo detrás. Para estética estilizada, Midjourney v7 mantiene la corona.

En un stack de 2026, la jugada correcta es usar FLUX donde la fidelidad fotográfica importe y meterlo en una plataforma que gestione el resto del pipeline. Esa plataforma es Vuela.ai.

FAQ de la reseña de FLUX

¿Qué capa de FLUX debería usar? +

[pro] para entregables a cliente que necesitan la mejor calidad, [dev] para prototipado no comercial con pesos abiertos, [schnell] para iteración rápida y volumen, Kontext para cadenas de edición prompt+imagen.

¿Puedo auto-hospedar FLUX? +

Sí para [dev] y [schnell] — ambos tienen pesos abiertos. [pro] es cerrado y solo por API. Auto-hospedar [dev] requiere GPU de 24GB+; [schnell] corre en hardware menor.

¿En qué se diferencia FLUX de Stable Diffusion 3? +

FLUX lo construyen ex-investigadores de Stability AI y supera significativamente a SD3 en benchmarks de fotorrealismo. La mayoría de equipos que usaban SD3 en 2024 se movieron a FLUX a mitad de 2025.

¿FLUX renderiza texto dentro de las imágenes? +

Mejor que la mayoría de modelos de imagen, peor que Ideogram 3.0 o Nano Banana Pro en tipografía de calidad póster. Para titulares y copy corto, FLUX está bien; para etiquetas densas de datos, los modelos dedicados a texto siguen liderando.

¿Puedo usar FLUX dentro de Vuela.ai? +

Vuela.ai expone calidad de imagen tipo FLUX junto con generación de vídeo, clonador, traductor lip-sync y más de 70 herramientas. Un plan plano en vez de apilar agregadores y plataformas de inferencia.

Construye tu pipeline con Vuela.ai

Acceso plano a los mejores modelos, más clonador, traductor lip-sync y más de 70 herramientas.