Top +10: las mejores IA generadoras de imágenes

La inteligencia artificial avanza a un ritmo vertiginoso, ofreciendo novedosas soluciones, muchas de las cuales ya hemos adoptado como algo cotidiano. Y una de las tecnologías que parece predestinada a convertirse en una herramienta más que presente en nuestro día a día son las IA generadoras de imágenes. Sistemas capaces de crear imágenes realistas o ilustraciones a partir de descripciones escritas por sus usuarios.

Si todavía no conoces estas herramientas o si solamente has oído hablar de unas pocas, te traemos un listado, ordenado en base a nuestro criterio de uso y conocimientos en la materia, de las IA generadoras de imágenes más sonadas actualmente. Además, al final del artículo te daremos consejos sobre cómo crear buenos prompts para conseguir los mejores resultados.

  1. Midjourney
  2. Dalle-3
  3. Dreamstudio
  4. Firefly
  5. Krea.ai
  6. Ideogram
  7. StableDiffusion Web
  8. Pikaso
  9. Nightcafe
  10. Stable Doodle
  11. Stable Diffusion XL

El protagonismo que estos modelos están cobrando ha ido in crescendo y, lejos de detenerse, continúa aumentando. Así mismo, su complejidad y su capacidad de comprensión y ejecución también han evolucionado, pasando de unos sencillos prototipos iniciales a modelos con resultados más que precisos.

Estas inteligencias artificiales son capaces de lograr un entendimiento profundo del lenguaje escrito, generando imágenes que se ajusten a la descripción indicada. Toda una revolución que democratiza la creación de imágenes e ilustraciones, acercando el diseño a todo el mundo, independientemente de sus habilidades artísticas.

1.Midjourney

Midjourney es un pequeño laboratorio de investigación independiente que busca abrir nuevos caminos y expandir la creatividad humana. Actualmente cuenta con 11 miembros y un conjunto de asesores.

Para poder hacer uso de su IA generadora de imágenes puedes probar una demo o comenzar la experiencia completa. En ambos casos será necesario que accedas con una cuenta de Discord, y podrás acceder mediante Midjourney Bot o la plataforma web. Una vez hecho esto, deberás escoger una de las tarifas que ofertan para poder hacer uso de Midjourney.

Cada vez que introduzcas un texto se generarán 4 opciones de imágenes, lo cual suele tardar un minuto, una media de tiempo más que razonable. Tras esto, aparecerán dos filas de botones, los cuales podrás usar para ampliar las imágenes y para editarlas a tu gusto.

2.Dalle-3

La nueva y mejorada versión de Dalle-2, la IA generadora de imágenes desarrollada por OpenAI. El principal avance de Dalle-3 con respecto a su antecesora (y a otras IA) es que entiende mejor y de forma mucho más completa las descripciones de texto que los usuarios introducen para generar las imágenes. De este modo, aprender prompt engineering, es decir, aprender a hacer descripciones precisas para poder conseguir los resultados que buscan mediante la IA, ya no es tan necesario. Eso sí, recuerda que cuanto más preciso sea tu prompt, más lo será tu obra.

Así mismo, las imágenes que generes con Dalle-3 serán tuyas, no necesitas permiso de OpenAI para imprimirlas, venderlas o utilizarlas. Esta IA está integrada de forma nativa en los planes de pago ChatGPT, fusionando las capacidades de ambas herramientas.

No obstante, es posible disfrutar de Dalle-3 de forma gratuita, ya que Microsoft la ha integrado en el chatbot de Bing (ahora llamado Copilot).

Para ello tan solo hay que acceder al buscador de Bing, pasar a Copilot y pedirle que cree la imagen que desees. La herramienta generará un máximo de cuatro imágenes de cada vez (a veces hace solo tres), y te permitirá descargar todas las que quieras. Además, una vez cree las obras, te sugerirá nuevas indicaciones que puedes utilizar para completar o modificar tus imágenes.

Otra característica muy útil de Dalle-3 es su capacidad para incluir palabras o frases a las imágenes. Aunque cabe señalar que, por ahora, esta función a veces no escribe correctamente algunas palabras. Un avance que sí ha mostrado es que ya es capaz de escribir en español, cuando antes solo lo hacía en inglés, aunque tu petición no fuese en ese idioma.

3.Dreamstudio

La tercera herramienta de nuestro listado es la creada por Stability AI, una comunidad formada por más de 140.000 desarrolladores. Dreamstudio se basa en el modelo de generación de imágenes de código abierto nombrado como Stable Diffusion.

Lo que diferencia a Dreamstudio de otras IA generadoras de imágenes son dos puntos, principalmente. El primero es que todo el mundo puede acceder a ella comenzando por una primera prueba gratuita. Una vez agotadas las imágenes gratis, se debe pagar una recarga mínima de 10 libras para continuar usándola. Así mismo, las imágenes se generan bajo una licencia que permite su uso tanto comercial como no comercial. El segundo es que esta no se trata de un modelo cerrado, además desde Stability AI animan a los usuarios a realizar revisiones públicas y aportar mejoras que impulsen y potencien la herramienta.

Así mismo, Dreamstudio ofrece un amplio abanico de parámetros que puedes modificar para ajustar el resultado a tu gusto:

  • Estilo artístico de la obra.
  • Seleccionar el ancho y el alto de la imagen.
  • Número de imágenes generadas.
  • «Prompt strenght»: cuanto más alto sea el valor que indiques, mayor será el grado de similitud entre tu descripción y la imagen final.
  • Número de pasos que se dedicarán a la creación.
  • Modelo bajo el que trabajará la herramienta.

No obstante, dependiendo de la configuración que establezcas, esto consumirá más o menos créditos de imagen. Por lo que deberás estar atento para no agotar el límite de imágenes gratuitas.

Así mismo, desde hace no mucho esta IA también permite editar las obras que generes con ella o las imágenes que subas desde tu dispositivo. Desde Stability AI continúan trabajando en Dreamstudio, lanzando nuevos modelos (como el SDXL que actualmente se encuentra en fase beta), y realizando mejoras, con las que se pretende que la herramienta continúe aprendiendo y se disminuyan los posibles resultados adversos derivados de los malos significados, estigmas o connotaciones negativas ligados al lenguaje y cómo lo empleamos.

4.Firefly

Para poder utilizar la IA generadora de imágenes desarrollada por Adobe debes cumplir dos requisitos: tener más de 18 años y una cuenta en Adobe. Esta herramienta ha sido entrenada con conjuntos de datos de licencia abierta y Adobe Stock, en colaboración con NVIDIA, empresa tecnológica estadounidense especializada en la creación de unidades de pensamiento gráfico. El que Firefly haya sido diseñada de este modo sería una garantía, en principio, para evitar problemas relativos a los derechos de autor.

Cuenta con un plan gratuito y uno de pago, con el primero dispondrás de 25 créditos mensuales y con el segundo 100. Utilizar esta IA es sencillo, podremos generar imágenes a partir de una descripción escrita y, por supuesto, ajustar parámetros como el estilo, color, dimensiones, iluminación o composición de la imagen.

Otra característica relevante de Firefly es la variedad de posibilidades que presenta. No solo podrás crear obras de cero, sino que también tendrás la opción de añadir objetos o ampliar la imagen tomando en consideración el contexto inicial, de modo que todo quede armónico; crear efectos de texto; variaciones de color, etc.

Así mismo, Adobe está trabajando en nuevas funciones como el modelaje 3D o la generación imágenes a partir de bocetos propios, sin necesidad de texto. 

Para acceder a Firefly puedes hacerlo desde su plataforma web, pero, además, está integrada en el paquete beta de creación de contenidos Adobe Express.

5.Krea.ai

La particularidad de esta IA es que es un generador en tiempo real a través de bocetos y prompts. Para ello, la herramienta te proporcionará un lienzo en el que podrás dibujar, insertar formas geométricas e imágenes, cargar más imágenes desde tu dispositivo y borrar elementos.

Krea.ai se trata de una IA bastante intuitiva y cuyo manejo no implica demasiadas dificultades, si bien es cierto que al principio puede resultar un poco abrumadora ya que esta irá generando resultados mientras tú pruebas sus diferentes herramientas. Una gran noticia es que, aunque cuenta con planes de pago, también tiene una versión gratuita de lo más funcional.

Las opciones de edición se encuentran concentradas en dos barras de herramientas a ambos lados de la pantalla. En la barra derecha encontrarás opciones de estilo para aplicar a tu obra (HD, foto, dibujo animado…), opciones de mejora de la calidad, de descarga, de dimensiones y la posibilidad de combinar ambos lienzos para trabajar directamente sobre la obra cambiante. Mientras que, en la izquierda encontrarás las distintas posibilidades creativas:

  • Text2Img: la versión más «tradicional», la de texto a imagen. Introduce un prompt de texto y crea tu obra.
  • Img2Img: lo que hace diferente a esta IA. Además de escribir un prompt, interactúa con el lienzo creando tu boceto para guiar a la herramienta.
  • Screen2Img: comparte pantalla con Krea.ai y genera una obra a partir de lo que le muestres. Incluye las opciones de edición de Img2Img.
  • Camera: dale acceso a la cámara de tu dispositivo y crea obras en función de lo que estés captando. También incluye las opciones de edición de Img2Img.

Para explicar su panel de edición nos centraremos en la opción Img2Img, ya que este es el mismo para las versiones Screen2Img y Camera. Como puedes ver en la siguiente imagen, el panel de edición consta de dos lienzos: el izquierdo es con el que el usuario interactúa y el derecho donde la IA genera la obra.

Las herramientas de edición son las siguientes:

  • Select: para mover imágenes, formas y demás elementos de tu boceto.
  • Shapes: para insertar círculos, rectángulos o triángulos.
  • Generate image: permite generar una imagen con IA a través de un prompt propio o aleatorio para incluir en tu boceto.
  • Upload image: sube una imagen de tu dispositivo para enriquecer tu boceto o basarte en ella.
  • Paint brush: pincel para pintar a mano. Puedes escoger el grosor del trazo y el color.
  • Eraser: borrador para eliminar trazos o partes de las formas geométricas.
  • Canvas background: inserta un color, fotografía (de Krea.ai o de tu dispositivo), texturas o ilustraciones como fondo de tu boceto.
  • Undo: para deshacer tus pasos.
  • Redo: para rehacer acciones que hayas deshecho con «undo».
  • Clear canvas: borra tu lienzo para volver a empezar de cero.

6.Ideogram

Esta IA se distingue de las demás por estar especializada en la inserción de texto en las imágenes que genera. Además de crear grandes obras de arte, podrás incluir palabras, frases o composiciones de texto en estas, elevando las posibilidades creativas.

Para acceder a Ideogram tan solo tienes que registrarte en su plataforma con tu cuenta de Google o de Apple. La herramienta tiene una versión gratuita, con la que dispondrás de 25 créditos al día, y tres planes de pago: Basic (7$/mes), Plus (16$/mes) y Pro (48$/mes).

Una vez te hayas registrado, accederás a su página de inicio, la cual te mostrará todo lo que necesitas. En la parte superior se encuentra la barra de texto desplegable con la que podrás crear imágenes. Bajo esta verás tres opciones:

  • Explore: una galería de imágenes generadas por otros usuarios, perfecta para inspirarte.
  • Following: un feed en el que aparecerán los creadores a los que decidas seguir en la plataforma.
  • Top: pestaña en la que ver las creaciones con más likes del día, la semana o el mes.

A la hora de crear, solo tendrás que introducir tu frase en la barra de texto (al igual que con otras IA, te recomendamos hacerlo en inglés), seleccionar o no alguno de los 18 estilos artísticos que ofrece la herramienta y modificar las opciones de ajustes. Aunque esto último estará más o menos limitado dependiendo del plan que uses.

En el gratuito solo podrás utilizar el magic prompt (herramienta que corrige y mejora tu prompt inicial para conseguir variedad de imágenes), ajustar las dimensiones de la obra y seleccionar si quieres usar el modelo 0.2 o el nuevo 1.0 de esta IA.

Ideogram generará cuatro imágenes para ti y podrás descargarlas todas.

7.StableDiffusion Web

Sí, en efecto, esta herramienta también se basa en el mismo modelo (Stable Diffusion) en que lo hace Dreamstudio. Aunque en sus inicios era totalmente gratuita y no pedía ningún registro para poder usarse, ahora deberás crear una cuenta para poder hacer uso de ella. El plan que se te aplicará por defecto es el gratuito, con el que tendrás 10 créditos que se restablecerán cada 24 horas. Para conseguir mayor cantidad de créditos y mejores condiciones puedes suscribirte a uno de los dos planes de pago.

En cuanto a su funcionamiento, además de introducir el prompt, podrás seleccionar uno de sus 18 estilos (o ninguno), determinar la relación de aspecto y si quieres generar una, dos o cuatro imágenes (esta última opción es exclusiva para suscriptores). Al igual que las herramientas anteriores, es muy rápida, creando imágenes en cuestión de segundos.

Algo a tener en cuenta en esta IA es que solo guardará las imágenes que generes durante siete días, así que te recomendamos que las descargues lo antes posible para no perderlas.

8.Pikaso

Pikaso se trata de otra IA generadora de imágenes en tiempo real a partir de texto, imágenes y bocetos, al igual que Krea.ai. Fue desarrollada a finales de 2023 por Freepik, el banco de imágenes y recursos audiovisuales español, y posee una interfaz muy intuitiva.

Su editor se compone de dos lienzos, uno al lado del otro. En el lienzo de la izquierda es donde se crea el boceto y en el de la derecha se irán generando resultados a medida que realices acciones. Además, en la parte inferior se presenta un cajón de texto donde escribir el prompt. y la opción «Imagination», que regula el nivel de creatividad de la IA.

Así mismo, en la parte izquierda de la pantalla se encuentra una barra de herramientas, donde se ofrecen herramientas de selección, dibujo, inclusión de iconos y elementos, carga de imágenes, etc. En cuanto a las opciones desplegadas a la derecha de la pantalla, estas incluyen la función «Enhace», que eleva la calidad de la imagen generada; la posibilidad de generar variaciones y de copiar la imagen generada en el lienzo de bocetos para trabajar sobre ella.

La única problemática que se nos puede presentar con Pikaso es que, al tratarse de una IA generadora en tiempo real, cada variación o añadido que realices en tu boceto provocará que se realice una nueva obra. Esto implica que los créditos se consuman a mayor velocidad y puede resultar algo agobiante, sobre todo si tienes el plan gratuito, el cual permite generar solo 20 imágenes al día. Puedes saber cuántas imágenes has consumido en el pequeño contador que aparece en la esquina superior derecha de la herramienta.

9.Nightcafe

Nightcafe fue creada por Angus Russell en noviembre de 2019 en Sydney, y con el paso de los años ha ido perfeccionándose hasta llegar a más de 5 millones de usuarios. Su nombre deriva de la obra de Vincent Van Gogh «El café de noche».

Además de generar imágenes acordes a un texto descriptivo, esta herramienta ofrece la opción de compartirlas con la comunidad, de modo que puedas presumir de la obra que Nightcafe y tú habéis creado.

La plataforma te ofrece 5 créditos gratuitos, con cada imagen que generes gastarás un crédito. Una vez tengas tu diseño, podrás compartirlo para que otros usuarios puedan disfrutar de él e inspirarse.

10.Stable Doodle

En el décimo puesto volvemos a toparnos con una IA desarrollada por Stability AI y basada en su modelo Stable Diffusion. No obstante, Stable Doodle ha sido creada a partir de una versión mejorada de este modelo combinada con T21-Adapter, una solución de control condicional.

El rasgo diferencial principal de Stable Doodle es que permite generar imágenes a partir de bocetos dibujados por el usuario. Además, es gratuita y puedes escoger entre registrarte en la herramienta o no. Eso sí, si no creas una cuenta tendrás una limitación diaria de unos 5 usos.

Esta tecnología es capaz de realizar un análisis del contorno del dibujo y crear una imagen con resultado profesional. Así mismo, el boceto se acompaña de una pequeña descripción o indicaciones escritas, que deberán ser introducidas en inglés. También es posible escoger entre 14 estilos artísticos para aplicarlos a tu obra y conseguir resultados más precisos.

Una vez cubiertos todos los campos necesarios, la IA generará tres imágenes y dará la posibilidad de descargarlas todas en alta definición. Los diseños que descargues presentarán una pequeña marca de agua en la esquina inferior derecha, para señalar que han sido creados con esta inteligencia artificial.

11.Stable Diffusion XL

Al igual que el caso anterior, este modelo también ha sido creado por Stability AI. Se trata de una versión mejorada de Stable Diffusion 2.0 que, al igual que otros productos de la desarrolladora, es de código abierto.

Stable Diffusion XL se ha entrenado con 3 veces más parámetros que sus predecesores. Esto le otorga mayor capacidad de comprensión e interpretación, permitiéndole entender mucho mejor las instrucciones que se le dan. Entre las mejoras que introduce Stable Diffusion XL, podemos destacar las siguientes:

  • Nuevas texturas, estilos y mejoras para crear manos y rostros más realistas y bien definidos.
  • Incorporación de texto verdaderamente legible y entendible en las imágenes.
  • Amplio rango de perspectivas.
  • Colores con más saturación.
  • Fusión de tonos para generar sombras, brillos y contrastes más realistas.

A diferencia de otros modelos del listado, este no cuenta con una web propia donde poder utilizarlo, sino que se ha integrado en Dreamstudio. También es posible probarlo en la web de Stability AI Clipdrop de forma gratuita o descargar la API e instalarlo en un ordenador. Así mismo, se ha anunciado su disponibilidad en SageMaker y Bedrock de Amazon Web Services.

Al utilizarlo en Clipdrop, se nos permite ihttps://marketing4ecommerce.net/ntroducir algunos ajustes a la hora de crear nuestra imagen. En primer lugar, podemos seleccionar un estilo artístico de entre 14 posibles, o determinar que no queremos ninguno en concreto. También se nos permite determinar las dimensiones y proporciones de la obra, y el «prompt negativo» (una descripción de aspectos o elementos que queremos que la IA evite al generar la obra).

Artículo publicado en https://marketing4ecommerce.net/

Compartir en:
X