[2024-1] 박지연 - Generative Adversarial Nets

* "$ $" 표시는 수식 표시

생성 모델을 adversarial process를 통해 추정하는 framework
2개의 모델을 동시에 훈련
- $G$ (generative model)
- : 데이터 분포를 포착하는 생성 모델이다. 이 모델의 훈련 절차는 모델 D가 실수할 확률을 최대화하는 것
- $D$ (discriminative model)
- : 샘플이 모델 G보다는 training data에서 나왔을 확률을 추정하는 판별 모델

Generative model
- maximum likelihood estimation과 관련된 많은 부정확한 확률 계산을 근사하는 것에 대한 어려움과 linear units의 장점 활용에 어려움이 있었음 ⇒ 본 논문에서는 이러한 어려움을 개선할 수 있는 새로운 generative model 추정 절차(adversarial nets framework)를 제안
Adversarial nets
- generative model은 adversary(적대자)와 맞서 싸운다.
- discriminative model은 샘플이 모델 분포에서 왔는지 데이터 분포에서 왔는지를 판단하는 것을 배운다. 쉽게 설명하면, generative model는 위조 지폐를 만드는 위조팀이라고 할 수 있으며, discriminative model은 위조 지폐를 탐지하는 경찰팀이다. 여기서의 경쟁은 위조품이 진품과 구별되지 않을때까지 양쪽 팀이 그들의 방법을 개선하도록 한다.

⇒ $D$를 학습 데이터와 $G$에서 샘플링한 데이터 모두에 올바른 레이블을 지정하는 확률을 최대화하도록 학습시킨다. 우리는 동시에 $log(1-D(G(z)))$를 최소화하는 $G$를 학습시킨다.

D&G → minimax game player이며 이 게임값의 함수 V(G,D) 식

(a) 수렴에 가까운 adversarial pair을 고려한다 : $p_g$는 $p_{data}$와 비슷하며 $D$는 부분적으로 정확한 분류기이다.

(b) 알고리즘 내부 루프에서 D는 데이터로부터의 샘플을 판별하도록 학습하고 $D^*(x) = p_{data}(x) / (p_{data}(x) + p_g (x))$로 수렴한다

(d) 여러 단계를 학습 후 , G와 D가 충분한 용량을 가지면, 둘 다 더이상 개선할 수 없는 지점에 도달하며, 이는 $p_g = p_{data}$ 이며 판별자는 더이상 두 분포의 차이를 구별할 수 없게 된다. 즉, $D(x) = 1/2$

Global Optimality of $p_g = p_{data}$
- Proposition 1. $G$는 고정되어 있고, optimal discriminator $D$가 다음과 같을 때

- Theorem 1. 가상 훈련 기준 $C(G)$의 전역 최솟값은 $p_g = p_{data}$인 경우에만 달성된다. 그 시점에서 $C(G)$는 -log4 값을 달성
Convergence of Algorithm 1
- proposition 2. $G$와 $D$의 용량이 충분하고, 알고리즘1의 각 단계에서 판별자가 주어진 $G$의 최적값에 도달할 수 있도록 허락되고, 생성 분포 $p_g$가 (1)기준을 개선하도록 업데이트 된다면 → $p_g$는 $p_{data}$에 수렴한다.
- (1) 기준

그림 2와 3 → 훈련 후 생성자 네트워크에서 생성된 샘플을 보여준다. 이 샘플들이 기존의 다른 방법으로 생성된 샘플들보다 낫다는 주장보다는, 이러한 샘플들은 최소한 문헌들에 나오는 더 나은 generative model과 경쟁할 정도임을 주장하며 adversarial framework의 잠재력을 강조한다.

단점
- 명확한 $p_g(x)$의 표현이 없다는 점
- 훈련 중에 D와 G의 동기화가 잘 이루어져야 함
장점
- 마코프 체인이 필요 없다
- gradients를 얻는데 오직 backprop만 사용됨
- 학습 중 별도의 추론 불필요
- 다양한 함수들을 모델에 통합 가능

[2024-2] 김경훈 - UNet++ : A Nested U-Net Architecture for Medical Image Segmentation (2)	2024.09.05
[2024-1] 홍연선 - ImageNet Classification with Deep Convolutional Neural Networks (0)	2024.06.29
[2024-1] 한영웅 - DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation, CVPR 2023, Google Research, Boston University (0)	2024.05.29
[2024-1] 김경훈 - SPVNAS : Searching Efficient 3D Architectures with Sparse Point-Voxel Convolution (0)	2024.05.21
[2024-1] 김경훈 - VoteNet (Deep Hough Voting for 3D Object Detection in Point Clouds) (0)	2024.05.14

관련글