(논문 요약) Neural Discrete Representation Learning (Paper)
핵심 내용
- Input 을 한정된 codebook 으로 encode
- $z_e(x)$: encoder 이후 압축된 feature
- $z_q(x)$: quantized vector (codebook 에서 L2 가 가장 작은 vector)
- 학습시 decoder 의 $z_q(x)$ gradient 를 $z_e(x)$ 로 그대로 전달하여 encoder 학습
- Loss 함수
- encoder: 1번째, 3번째 항으로 학습
- decoder: 1번째 항으로 학습
- embeddings: 2번째 항으로 학습
- sg: stop-gradient