


Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este articulo cient´ıfico estudia las Redes Generativas Antagonicas (GANs) describiendo los modelos estad ´ ´ısticos generativos en oposicion con los discriminativos. Tambi ´ en se estudian las partes que componen las GANs. Adem ´ as, se profundiza el entrenamiento ´ de las redes generativas antagonicas, as ´ ´ı como el fin de este proceso o el equilibrio de Nash o la solucion minimax. Adicionalmente, ´ se mencionan los problemas mas comunes que surgen en el entrenamiento de una GAN como la falt
Tipo: Resúmenes
1 / 4
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!



Resumen Este articulo cient´ıfico estudia las Redes Generativas Antag´onicas (GANs) describiendo los modelos estad´ısticos generativos en oposici´on con los discriminativos. Tambi´en se estudian las partes que componen las GANs. Adem´as, se profundiza el entrenamiento de las redes generativas antag´onicas, as´ı como el fin de este proceso o el equilibrio de Nash o la soluci´on minimax. Adicionalmente, se mencionan los problemas mas comunes que surgen en el entrenamiento de una GAN como la falta de convergencia, el colapso mental y la perdida no informativa. Este articulo tambi´en menciona las nuevas tecnolog´ıas producto de las GANs como las DCGAN, cGAN y las CycleGAN. Finalmente se analizan algunas de las aplicaciones y funcionalidades de estas redes como la generaci´on de nuevas im´agenes, mejoramiento de resoluci´on de im´agenes, entre otras.
Index Terms GANs, generador, discriminador, entrenamiento, equilibrio de Nash, im´agenes, resoluci´on.
N el 2014, Ian J. Goodfellow propuso un novedoso modelo de generaci´on de datos reconocido como Redes Generativas Antag´onicas (GANs, por su sigla en ingl´es.). Este modelo se convirti´o en “la idea m´as interesante de los ´ultimos 10 a˜nos en el ´area de Machine Learning”. Las GANs consisten en dos modelos (en general, redes neuronales convolucionales), el generador y el discriminador, entrenados simult´aneamente para desafiarse uno al otro, lo que explica el t´ermino “antag´onicas” elegido por los autores para darle identidad a este novedoso m´etodo. El generador es entrenado para generar datos falsos lo m´as parecidos posibles a los ejemplos reales de un determinado patr´on suministrado. Por otra parte, el discriminador est´a entrenado para ser capaz de filtrar los datos falsos producidos por el generador. Esto genera una competencia entre los dos modelos que intentar´an superarse continuamente. Entre sus exitosas aplicaciones est´a su implementaci´on en el ´area de im´agenes y visi´on por computadora, como el aumento de la resoluci´on de im´agenes automatizada y la s´ıntesis y manipulaci´on de im´agenes.
II-A. Componentes
Las GANs consisten en dos modelos entrenados simult´aneamente: el generador, entrenado para generar datos, y el dis- criminador, preparado para procesar y diferenciar los datos del generador (falsos) de los ejemplos reales. Al transcurso del proceso, la salida del generador es ruidosa y el discriminador predice de aleatoriamente a medida que se van entrenando ambas redes neuronales. En breves palabras, el generador mejora para evitar al discriminador y de igual manera, el discriminador mejora para poder distingir entre verdaderos o falsos los datos producidos por el generador. Formalmente, el generador y el discriminador se representan por funciones diferenciables G(z, θG) y D(x, θD ).Cada funci´o posee su propia funci´on p´erdida. A θG y θD se los reconoce como los par´ametros a entrenar de las dos redes. Cada red ajustar´a sus propios par´ametros al ser entrenada. [2]
II-A1. El generador: El generador (G) se encarga de “enga˜nar” al discriminador (D) pasando como datos del conjunto de entrenamiento, aquellos que fueron producidos a partir de un vector de ruido aleatorio. El generador debe obtener caracter´ısticas del conjunto de entrenamiento para que las muestras generadas sean indistinguibles de este conjunto. El generador podr´ıa pensarse como un reconocedor de patrones a la inversa. Es decir, en lugar de reconocer los patrones, el generador aprende a producirlos. En otros t´erminos, el generador recibe un vector de ruido aleatorio z muestreado a partir de una distribuci´on pz (z) (formalmente una distribuci´on Gaussiana) para luego producir una muestra de datos falsos x ˜, es decir: G(z) = x˜ II-A2. El discriminador: El discriminador predice si los datos corresponden al conjunto de entrenamiento (reales) o fueron producidos por el generador (ficticios). T´ecnicamente, discrimina entre la muestra falsa ˜x y x, los datos muestreados de la distribuci´on real de datos pdatos(x). En general, la arquitectura del discriminador es aproximadamente sim´etrica a la del generador. Esto facilita que la convergencia del entrenamiento sea alcanzada m´as f´acilmente.
II-B. Entrenamiento
La Figura 1 ilustra el proceso de entrenamiento de una GAN. Como se mencion´o, el entrenamiento del generador es m´as complejo que el entrenamiento del discriminador, que es simplemente un clasificador binario. El entrenamiento del discriminador es la inserci´on de un conjunto de entradas,las cuales algunas son reales (seleccionadas aleatoriamente del conjunto de entrenamiento) y otras falsas, que provienen del generador. La respuesta del discriminador debe ser 1 si los datos de entrada son reales, o 0 si los identifica como falsos, creados previamente por el generador. En el caso del generador, su entrenamiento debe condicionarcque los datos que generar´a debe “esquivar” al discriminador. Es decir, debe esforzarse por minimizar. log(1 − D(G(z))) que es equivalente a log(1 − D(G(˜x))). Para lograr esto, la salida del generador debe ser la entrada del discriminador, de tal manera que la salida de este modelo combinado nos da la probabilidad de que los datos generados son reales, de acuerdo con el discriminador. As´ı, el generador obtiene `‘‘ayuda”del discriminador, que utiliza para generar datos m´as parecidos al conjunto de entrenamiento.
Figura 1: Entrenamiento de una red GAN
En las iteraciones sucesivas , al momento del entrenamiento del discriminador, se actualizan sus pesos para maximizar la precisi´on de clasificaci´on. En cambio, cuando se entrena el generador (utilizando el modelo combinado), se actualizan los pesos del generador de manera tal que maximicen la probabilidad de que el discriminador clasifique a los datos generados a trav´es del vector de ruido aleatorio como reales. Es importante que cuando se entrena la combinaci´on de los dos modelos, los pesos del discriminador queden fijos, de forma que s´olo se actualicen los del generador. En caso contrario, el discriminador aumenta las probabilidades de predecir los datos del generador como reales, pero no por m´erito del generador, que es lo que se espera.
Equilibrio de Nash y fin del entrenamiento
En una GAN, se pretende que las dos redes alcancen objetivos contrapuestos, es decir, cuando una red mejora, la otra empeora. Sin embargo, es complejo pensar en un criterio inmediato para finalizar el entrenamiento. El m´etodo m´as sencillo de limitar el autoaprendizaje de una GAN es como si fuera un juego de suma cero. En la matem´atica aplicada, se reconocen a los juegos de suma cero a aquellos sistemas en los cuales la ganancia o p´erdida de un jugador se equilibra exactamente con las p´erdidas y ganancias del oponente. Es decir, la sumatoria entre las ganancias y las p´erdidas totales de los participantes es igual a cero. En 1928, John von Neumann desarroll´o el teorema minimax. Este teorema establece que en los juegos de suma cero, donde cada jugador conoce de antemano la estrategia de su oponente y sus consecuencias, existe una estrategia que permite a ambos jugadores minimizar la p´erdida m´axima esperada. Esta estrategia, o m´etodo, es denominada de igual manera: minimax. Las GANs, en su entrenamiento, implementan el m´etodo de decisi´on minimax para minimizar la p´erdida m´axima esperada. Formalmente, el generador y el discriminador juegan un juego de suma cero con funci´on objetivo L(G, D):
min G
max D
L(G, D) = Ex∼Pdatos [log D(x)] + Ez∼pz [log(1 − D(x)]
La soluci´on minimax es equivalente a lo que se denomina Equilibrio de Nash, que es el punto en el cual ning´un jugador tiene la capacidad de mejorar a trav´es de sus acciones. En las GANs, el Equilibrio de Nash le da fin al entrenamiento. Goodfellow et. al. en la publicaci´on precursora de las GANs, demostraron que el Equilibrio de Nash se alcanza cuando se cumplen dos condiciones:
El generador produce muestras que son indistinguibles de los datos del conjunto de entrada (pg = pdatos).
Figura 2
Las GANs pueden ser entrenadas para, a partir de im´agenes de baja resoluci´on, generar su contraparte de alta resoluci´on. Esto puede tener aplicaciones en varios campos, como en im´agenes m´edicas para permitir mejor detecci´on de patolog´ıas [23, 24, 25, 26, 27], en im´agenes astron´omicas, en determinadas escenas para permitir el reconocimiento de objetos, en im´agenes forenses, etc. Tambi´en se han utilizado GANs de super-resoluci´on para aumentar la resoluci´on en videojuegos viejos. Algunos juegos que han implementado esta tecnolog´ıa son: Final Fantasy VIII, Resident Evil 2 Remake HD Remaster (Figura 2) o Max Pay- ne. [1]
V-B. Creaci´on de nuevas im´agenes
Figura 3: Rostro genera- do por GAN
Las GANs pueden lograr que una m´aquina genere con rapidez im´agenes falsas pero realistas. Para ello, la red generadora usa la t´ecnica de aprendizaje autom´atico para estudiar un enorme n´umero de im´agenes, lo que esencialmente le ense˜na a crear las suyas de modo que parezcan aut´enticas. Luego las env´ıa a la red discriminadora, la cual ha sido entrenada para determinar la apariencia que tiene la imagen de una persona real. El discriminador califica cada una de las im´agenes del generador en funci´on de su realismo. Con el tiempo, el primero va mejorando en su tarea de producir im´agenes falsas, y el segundo mejora a la hora de detectarlas; de ah´ı el apelativo de antag´onicos o adversarios. De hecho, la persona de figura 3 est´a generada por una red GAN y por lo tanto no existe.
V-C. Fotos a partir de bocetos
Una de las capacidades de las redes GANs es generar posibles im´agenes a partir de bocetos, fotos de carreteras, edificios o de bolsos. Adem´as, es posible renderizar un mapa a partir de la imagen de sat´elite, convertir una foto de d´ıa a de noche y transformar una foto en blanco y negro a una en color. Adem´as, el aplicativo GauGAN de Nvidia permite bocetar un paisaje o entorno que no exista y transformarlo en una im´agen realista, como el de la Figura
(a) Renderizado de bocetos (b) Generador de paisajes con GauGAN
Figura 4: Generaci´on de im´agenes a partir de bocetos
Las GANs constituyen un tipo de modelo generativo muy poderoso y uno de los m´as ingeniosos respecto a su arquitectura matem´atica. Sin embargo, como toda tecnolog´ıa en auge, tiene sus ventajas y desventajas. Es por eso que actualmente, contin´ua siendo motivo de investigaci´on. Dentro del gran abanico de aplicaciones que permiten las GANs, la superresoluci´on de im´agenes y la generaci´on de im´agenes de alta resoluci´on han representado dr´asticamente a esta nueva tecnolog´ıa.
[1] Redacci´on APD. GANs o redes generativas antag´onicas: ¿Qu´e son y c´omo funcionan? Mayo de 2020. URL: https : //www.apd.es/gans-o-redes-generativas-antagonicas-que-son/. [2] Laura Randa Calcagni. Redes Generativas Antag´onicas y sus aplicaciones. Jul. de 2020. URL: http://sedici.unlp.edu.ar/ handle/10915/101507.