proZesa

"Imagen", la Inteligencia Artificial de Google que crea imágenes hiperrealistas con solo una descripción de texto

"Imagen" es una Inteligencia Artificial (IA) de Google capaz de generar imágenes hiperrealistas basándose en una simple y breve descripción de texto.

Según Jeff Dean, máximo responsable de la división de IA de la compañía, promete "liberar la creatividad conjunta entre humanos y ordenadores"

Esta IAs muy similar a DALL-E 2, la inteligencia artificial desarrollada por Open AI (compañía fundada por Elon Musk) que también permite generar imágenes basadas en una descripción de texto. No obstante, hay varias diferencias entre ambos modelos. Entre ellas, el nivel de detalle y la eficiencia al crear esa imagen.

Google, en concreto, asegura que su IA ofrece resultados con un nivel de detalle mucho más precisos respecto a otros sistemas. Para comprobarlo, creó un punto de referencia llamado DrawBench, el cual compara su modelo de IA con otros similares, como VQ-GAN+CLIP, Latent Diffusion Models o, incluso, DALL-E 2. Luego expuso los resultados "lado a lado" para que los "evaluadores humanos" puedan diferenciarlos y escoger el más realista. Los evaluadores, según Google, concluyeron que las imágenes de 'Imagen' tienen mayor calidad y mejor "alineación imagen-texto" respecto al resto de modelos.

"Imagen" es más rápida y eficiente que otras, también entiende descripciones más complejas

"Imagen" es "más eficiente en computación, más eficiente en memoria y converge más rápido" gracias a una arquitectura propia llamada U-Net. Los resultados, por tanto, son imágenes hiperrealistas generadas de forma más precisa que cualquier otro modelo y a partir de cualquier tipo de descripción de texto.

También puedes leer: DALL-E 2, la Inteligencia artificial que transforma palabras a imágenes fotorealistas

"Un pájaro extremamente enfadado", "una foto de un mapache con casco de astronauta, mirando por la ventana por la noche" o "un cerebro montando una nave espacial en dirección a la luna", son frases que Google ha utilizado como ejemplos para demostrar lo que es capaz de hacer su modelo de inteligencia artificial. Estos son algunos que podemos encontrar en su web.

Google, por otro lado, asegura que Esta IA puede crear imágenes con descripciones basadas en lugares específicos o, incluso, con textos enrevesados.

Es un proyecto interno y no está disponible para el público. Puede dar lugar a la creación de imágenes que contengan "estereotipos y representaciones perjudiciales", destaca la compañía.

Según Google, "'Imagen se basa en codificadores de texto entrenados en datos a escala web no curados y, por lo tanto, hereda los sesgos sociales y las limitaciones de los grandes modelos lingüísticos. Como tal, existe el riesgo de que Imagen haya codificado estereotipos y representaciones perjudiciales, lo que guía nuestra decisión de no liberar Imagen para uso público sin más salvaguardias."
https://prozesa.com/?p=4081

Buscar este blog

Comentarios

Publicar un comentario

Entradas populares de este blog

Todo lo que necesitas es…

Consiguen restaurar la visión en ratones ciegos [VÍDEO]