Stability AI sigue innovando en el campo de la generación de imágenes a partir de texto, con el lanzamiento de su nuevo modelo generador de imagen Stable Diffusion XL 1.0, disponible en versión beta en DreamStudio. También es posible descargar la API del modelo o probarlo, por ejemplo, en Clipdrop de forma gratuita. Así mismo, se ha anunciado su disponibilidad en SageMaker y Bedrock de Amazon Web Services.

Este vendría a mejorar (e incluso podría decirse que a reemplazar) las funciones ofrecidas por Stable Diffusion 2.0, brindando varias novedades y detalles interesantes, además de una calidad de imagen muy parecida a Midjourney. Según ha informado la empresa en su sitio web, Stable Diffusion XL «es un avance significativo en las capacidades de generación de imágenes, que ofrece una composición de imágenes mejorada y generación de rostros que dan como resultado imágenes impresionantes y una estética realista».

En ocasiones anteriores, Stability AI ha afirmado que quiere promover el acceso libre a las tecnologías de última generación. Por lo que Stable Diffusion XL es, al igual que todos los modelos de la compañía, de código abierto, con el que se puede acceder a un número limitado de imágenes sin siquiera registrarse al servicio, aunque este número aumenta al completar el registro correspondiente. Para acceder a todo el abanico de funciones mejoradas y ventajas que ofrece este nuevo modelo es necesario pagar una suscripción.

Diferentes tipos de imágenes hiperrealistas creadas con Stable Diffusion XL

Mejoras que ofrece Stable Diffusion XL 1.0 

Una de las primeras características que llama la atención de este nuevo modelo, es que aborda uno de los problemas más comunes de los modelos de IA generadores de imágenes: las manos. Siendo esta una de las partes más complicadas del cuerpo de crear, Stable Diffusion XL proporciona nuevas texturas, estilos y mejoras para crear mejores manos.

Asimismo, otro problema muy común con las herramientas de IA generadoras de imágenes es la incorporación de texto dentro de la imagen, ya que este no resulta legible debido a la falta de detalle en la imagen. En este sentido, Stable Diffusion XL promete crear texto perfectamente legible sin problema.

Otras de las mejoras del modelo es que cuenta con un amplio rango de perspectivas y brinda una vista previa de cómo se verá la imagen. Además, ahora los colores de las imágenes tendrán mucha más saturación y fusiona los tonos de tal forma que generará sombras, brillos y contrastes mucho más realistas.

Por su parte, Stable Diffusion XL ha sido entrenado con 3 veces más parámetros que sus versiones anteriores, lo que lo hace más inteligente y le da al modelo la capacidad de entender mucho mejor las instrucciones que se le dan y entregar exactamente lo que se le pide, fusionando un sistema base y un sistema refinador de imágenes. Además, las imágenes se podrán generar a partir de instrucciones o prompts más sencillos, por lo que con una sola línea de texto es posible comenzar a generar imágenes desde cero.

Si quieres conocer más a fondo todas las características que ofrece Stable Diffusion XL y como usarlo gratis, el canal de YouTube de Dot CSV ofrece un resumen bastante completo de la herramienta. Te dejamos el vídeo.

Foto: Stability AI

 

Mantente informado de las noticias más relevantes en nuestro canal de Telegram

Leave a Reply

Your email address will not be published. Required fields are marked *