Los usos de los algoritmos de la denominada inteligencia artificial se han ido extendiendo a muchas áreas en los últimos años, y la fotografía es una de ellas. Nvidia, compañía californiana especialmente conocida por sus unidades de procesamiento gráfico –GPU– que incluyen muchos de nuestros ordenadores–, es una de la más prolíficas en este terreno, y atesta la importancia que la IA tiene y va a tener en el mundo fotográfico.
Recientemente, ya hablamos de algunos de los últimos trabajos de su equipo de investigadores, que habían usado redes de aprendizaje profundo –deep learning– para restaurar fotografías con mucho ruido o para ‘completar’ imágenes a las cuales les faltaba parte de información.
En esta ocasión, sus investigadores han conseguido desarrollar un algoritmo capaz de generar imágenes que imitan la apariencia de fotografías reales. Lo llamativo de este nuevo trabajo, publicado hace apenas unos días en su artículo ‘A Style-Based Generator Architecture for Generative Adversarial Network‘, es la gran calidad de los resultados reproducidos, que representan un claro salto cualitativo con respecto a los anterior desarrollos.
De hecho, tal como se explica en el artículo, este algoritmo se basan en las redes generativas conocidas con el nombre de GAN –Generative Adversarial Networks–, que ya habían sido usadas con anterioridad, pero que a la vista de los primeros resultados obtenidos –publicados en este otro artículo de 2014 de la Universidad de Montreal–, apenas se podía presagiar el importante avance realizado, apenas cuatro años más tarde.
Para la síntesis de estas imágenes, Nvidia realiza una copia de estilos en las imágenes generadas, un concepto similar al que ya expuso la compañía en su algoritmo ‘fotorrealista’ para la transferencia de estilos entre fotografías.
Tal como detallan sus investigadores, para “alimentar” el algoritmo durante su fase de training se usa una FFHQ –Flickr-Faces-HQ–, una base de imágenes descargadas de Flickr –con las licencias pertinentes, por supuesto–, que se ajustan convenientemente de forma automática.
El generador trata una imagen como una colección de “estilos” –clasificados en gruesos, medios y finos–; cada uno de ellos está asociado a un rasgo o conjunto de rasgos en particular –pose, pelo, perfil de la cara, ojos, color de la piel, etc.–, y ajustando sus parámetros se controlan los efectos sobre la imagen final generada.
Por supuesto, el algoritmo no es perfecto, y mediante una inspección más detallada se pueden observar ciertos patrones que permiten revelar que la imagen ha sido generada artificialmente. La –imprecisa– reproducción del pelo o la –en ocasiones– falta de simetría en lo ojos son algunos de los aspectos que más cuestan “entender” a los algoritmos de IA.
Junto con el artículo, el equipo de investigadores de Nvidia también ha publicado un vídeo muy ilustrativo donde se detalla todo el proceso realizado para la generación de estas imágenes artificiales.
El algoritmo de Nvidia no se restringe solo a la generación de retratos ficticios, sino que también es capaz de generar otro tipo de imágenes –como coches o dormitorios– siguiendo los mismos principios expuestos más arriba, pero usando como entrada una base de imágenes de referencia adecuada.
Más allá de lo asombro de los resultados conseguidos, la madurez de esta tecnología da pie a plantearse diversas cuestiones sobre la autenticidad de las imágenes, especialmente en una época como la nuestra en la que la veracidad de la información es cada vez más difícil de corroborar.
Existen hoy en día muchos casos en los que las imágenes generadas artificialmente con apariencia fotográfica son de gran utilidad –gran parte de las imágenes de los catálogos de IKEA son creadas por CGI, según reveló en su momento la Computer Graphics Society– y seguramente este tipo de algoritmos abrirá también la puerta a replantearse cómo se obtendrán en un futuro –no muy lejano por lo visto– las imágenes de stock. ¿Podremos generar cualquier tipo de imagen que necesitemos de forma artificial?