Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.
Autor: Francisco Palomo, Responsable de Innovación con IA para Arquitectura
Los modelos de IA generativa FLUX Kontext y Nano Banana representan el estado del arte (SOTA) en la aplicación de la inteligencia artificial al diseño arquitectónico. FLUX potencia la ideación y coherencia espacial, permitiendo generar imágenes arquitectónicas realistas a partir de texto, mientras que Nano Banana destaca en la edición inteligente, ajustando luz, materiales o atmósfera con lenguaje natural. Combinados en entornos como Weavy, estos modelos eliminan barreras técnicas y sitúan la creatividad en el centro del proceso, redefiniendo cómo los arquitectos visualizan y comunican sus proyectos.
Índice de Contenidos
La nueva era de los modelos de IA en arquitectura
El concepto SOTA (State of the Art) define el punto más avanzado del desarrollo tecnológico actual. En el campo de la inteligencia artificial generativa, hace referencia a los modelos más precisos, coherentes y capaces de entender el contexto visual y espacial de una escena. En el ámbito de la arquitectura, estos avances han transformado profundamente la forma en que los profesionales imaginan, visualizan y comunican sus proyectos.
Entre todos los modelos disponibles hoy, destacan dos por su aplicación directa en la práctica arquitectónica: FLUX Kontext y Nano Banana. Ambos representan la frontera actual de la IA generativa aplicada a la imagen arquitectónica, combinando potencia, coherencia y control.
Esta nueva generación de modelos marca también un cambio de paradigma. Lo que antes requería cadenas de instrucciones técnicas y procesos complejos en entornos como ComfyUI, hoy puede resolverse con lenguaje natural.
Gracias a los modelos multimodales, la IA es capaz de entender no solo las palabras, sino la intención detrás de ellas: “hazlo más diurno”, “cambia la iluminación”, “transforma este croquis en una imagen realista”. La técnica se diluye, dejando espacio a la creatividad y a la comunicación visual directa.
Modelos SOTA para arquitectura
FLUX Kontext: ideación y coherencia espacial
FLUX Kontext es el modelo de referencia en la fase de ideación arquitectónica. Su fuerza reside en la capacidad de generar imágenes a partir de descripciones en lenguaje natural, manteniendo coherencia espacial, material y atmosférica. Esto lo convierte en una herramienta perfecta para explorar conceptos, crear moodboards o visualizar ideas en fases tempranas del proyecto.
Además, al tratarse de un modelo OpenSource, FLUX puede entrenarse con datasets específicos para obtener resultados ajustados a una identidad arquitectónica concreta. Esto abre la puerta a estudios que deseen generar imágenes fieles a su estilo, materialidad o lenguaje visual.

Imagen creada con el modelo LoRA “ExteriorSpaceCrafter” entrenado específicamente para el modelo Flux. Gracias al entrenamiento de modelos OpenSource con datasets específicos, conseguimos unos resultados alejados del estilo “genérico” que nos devuelven los modelos, consiguiendo resultados alineados con un estilo de imagen específico.
En la práctica, FLUX Kontext permite transformar una idea abstracta en una imagen arquitectónicamente verosímil en cuestión de minutos, acelerando la comunicación interna y el desarrollo conceptual.
Nano Banana: la edición llevada al límite
Mientras FLUX Kontext brilla en la ideación, Nano Banana domina la edición visual. Su poder radica en la capacidad de interpretar imágenes existentes y modificarlas mediante instrucciones naturales, con resultados de una fidelidad extraordinaria.
Entre sus aplicaciones más potentes destacan:
- Mejora de imágenes aéreas de Google Earth, transformándolas en composiciones con calidad profesional.

Mediante lenguaje natural, pedimos al modelo Nano Banana que transforme un screenshot de Google Earth a una imagen de dron foto realista. Además, modificamos la iluminación, manteniendo la coherencia geométrica del conjunto.
- Optimización de renders o fotografías, ajustando luz, atmósfera o materiales sin alterar la geometría original.

“Usa la imagen proporcionada. Mantén la arquitectura y la composición del edificio sin cambios. Cambia la iluminación a una luz diurna clara y brillante, proyectando sombras naturales y realistas.” Con un prompt natural y específico conseguimos modificar la iluminación natural de la escena consiguiendo un resultado que respeta la geometría y composición de la imagen original en Nano Banana.
- Conversión de bocetos o dibujos en imágenes realistas manteniendo la estructura y la coherencia visual.

“Transforma este boceto en una imagen fotorrealista de un edificio moderno. El edificio debe tener grandes ventanales de cristal y una estructura contemporánea, similar a la del boceto. Añade detalles realistas como la textura de los materiales, reflejos en los cristales y la iluminación ambiental de un día claro. Incluye personas y un entorno urbano sutil para dar vida a la escena, manteniendo la composición y la perspectiva del boceto”.
Con un prompt sencillo, en el que se describe el resultado, conseguimos una imagen realista que respeta la geometría definida en un boceto que utilizamos como input.
Nano Banana es, en definitiva, un editor inteligente que comprende la imagen y la reinterpreta según los parámetros que definimos, combinando control y libertad creativa.
Weavy: un entorno unificado para la creatividad
Para sacar el máximo partido a estos modelos, surge Weavy, un entorno de trabajo intuitivo que reúne bajo una misma interfaz los principales modelos generativos, incluyendo FLUX y Nano Banana. Weavy elimina la fricción técnica y pone el foco en la experiencia creativa: experimentar, comparar y combinar modelos sin cambiar de entorno.

La estructura de nodos de la interfaz de Weavvy permite el uso de varios modelos y worksflows en un mismo entorno, agilizando los procesos y permitiéndonos cretrarnos en la calidad creativa de los resultados
Gracias a esta integración, podemos generar, editar y refinar imágenes en un flujo continuo, explorando todo el potencial de la IA sin perder agilidad ni precisión.
Conclusión: dominar la herramienta para dominar la imagen
El verdadero reto no es solo conocer los modelos, sino aprender a hablar su lenguaje. La mayoría de ellos han sido entrenados con imágenes centradas en personas o entornos genéricos, no específicamente en arquitectura. Por ello, comprender cómo guiar al modelo, cómo estructurar los prompts y cómo ajustar sus respuestas es clave para obtener resultados realmente arquitectónicos.
La IA generativa no reemplaza la mirada del arquitecto: la amplifica. Los modelos SOTA abren una nueva forma de imaginar y construir visualmente el espacio, transformando la manera en que concebimos cada proyecto. Si quieres aprender a integrarlos en tu proceso creativo y dominar su aplicación práctica, puedes hacerlo a través del Máster en Visualización Arquitectónica de The Factory School.

También puede interesarte:
IA para visualización arquitectónica: qué IA usar según la fase de tu proyecto
Guía definitiva para escribir prompts IA para arquitectos
Qué es Weavy y cómo está transformando la visualización arquitectónica con IA
Preguntas Frecuentes
Preguntas frecuentes sobre FLUX Kontext y Nano Banana
FLUX es ideal para fases tempranas de diseño: concursos, ideación conceptual o creación de moodboards. Permite generar vistas arquitectónicas coherentes con una descripción en texto, agilizando la comunicación de ideas sin depender de renders 3D iniciales.
Sí. Al ser un modelo abierto, puede entrenarse con ejemplos de proyectos del propio estudio, logrando resultados consistentes con su identidad visual. También es posible guiar el estilo mediante prompts bien estructurados o referencias visuales.
No del todo. Aunque alcanza un nivel de realismo impresionante, Nano Banana brilla especialmente en la postproducción y edición. Permite mejorar renders existentes, ajustar iluminación o atmósfera, pero no sustituye el control geométrico de un software 3D.
Desde fotografías y renders hasta capturas aéreas o bocetos. El modelo puede reinterpretar y mejorar cualquier imagen, siempre que haya suficiente información visual para mantener la coherencia.
No necesariamente. Aunque herramientas como ComfyUI permiten un control profundo, plataformas más accesibles —como Weavy— simplifican el proceso, permitiendo trabajar con lenguaje natural sin necesidad de ajustes técnicos.
Usar prompts que incluyan referencias arquitectónicas claras: materiales, escalas, atmósferas y funciones del espacio. Comprender cómo guiar al modelo es clave para traducir una idea conceptual en una imagen arquitectónica sólida.