I. 서론 최근 딥러닝 기술 중 생성 모델(Generative Model) 관련 연구가 활발하게 이루어지고 있다. 지난 몇 년간 생성 모델은 GAN(Generative Adversarial Networks), VAE(Variational Autoencoder) 등에 대한 연구가 주를 이루었고, 2021년 상반기 국제 딥러닝 컨퍼런스 ICLR (International Conference on Learning Representations) 2021에서는 Score-based 모델 등에서 의미 있는 연구결과가 제시되었다[1]. 가트너는 최근 심포지엄에서 ‘Top Strategic Technology Trends for 2022’라는 주제 로 트렌드 기술 12가지를 발표하였는데, 이 기술들 중 하나가 ‘Generative AI’이다[2]. 가트 너는 현재 시장에서 가장 강력하고 가시적인 인공지능 기술 중 하나가 ‘Generative AI’라고 하였고, 2025년이면 세계적으로 생성되는 데이터의 10%가 ‘Generative AI’에 의해 만들어 질 것이라고 전망하였다[3]. 생성 모델은 다양한 산업 분야에서 활용되고 있는데, 금융 산업에서도 생성 모델을 활용하 는 연구가 계속되고 있다. 이상거래탐지를 위한 FDS(Fraud Detection System)에서 데이 터 불균형 문제를 해결하기 위해 GAN 모델을 활용하는 연구, VAE 모델을 활용하여 이상탐 지를 하는 연구 등이 그것이다. 본 고에서는 다양한 생성 모델들 중에 그간 연구가 활발했던 GAN 모델과 VAE 모델을 살펴보고, 이들 모델의 최근 연구 동향 및 금융 산업에서의 활용에 대해 살펴보고자 한다. 본 고의 구성은 다음과 같다. II장에서는 생성 모델의 기본 개념과 모델의 종류를 살펴본 * 본 내용은 임선규 과장(☎ 02-531-1306, sklim@kftc.or.kr)에게 문의하시기 바랍니다. ** 본 내용은 필자의 주관적인 의견이며 IITP의 공식적인 입장이 아님을 밝힙니다. 생성모델(Generative Model) 연구 동향 및 금융에서의 활용 Chapter 02 주간기술동향 2021. 12. 8. 18 www.iitp.kr 다. III장과 IV장에서는 각각 GAN 모델과 VAE 모델에 대해 살펴본다. V장에서는 연구 동향 및 금융 산업에서의 활용에 대해 살펴보고, 마지막으로 VI장에서는 향후 전망을 제시한다. II. 생성 모델 머신러닝(Machine Learning)에서 데이터의 분류(Classification)를 위한 모델은 판별 모델(Discriminative Model)과 생성 모델(Generative Model)로 구분할 수 있다. 판별 모델은 데이터 x를 분류하는 레이블 y를 결정하기 위해 조건부 확률 p(y|x)를 극대화하는 y를 찾는다. 즉, 모델에서 직접적으로 p(y|x)를 학습하여 y를 결정한다. 반면, 생성 모델은 데이터 x의 레이블 y를 결정하기 위해 간접적으로 결합확률 P(x,y)를 학습하거나, 만약 레이 블이 없다면 p(x)를 학습한다. 다시 말해, 판별 모델이 레이블의 차이를 적절하게 구분하는 결정경계(Decision Boundary) 를 학습하여 데이터가 어떤 레이블을 갖는지 결정하는 모델이라면, 생성 모델은 데이터의 분포(Distribution)를 학습하여 주어진 데이터가 어떤 분포에 속할 확률이 높은지 결정하는 모델이다. [그림 1]은 판별 모델과 생성 모델의 이러한 특징을 개념적으로 보여준다. 생성 모델은 모델의 구성방식에 따라 다양하게 분류할 수 있다. [그림 2]는 생성 모델의 분류를 나타낸다. 우선 학습 데이터의 확률 분포를 알고 있는 상태에서 추정하는 Explicit Model과 확률 분포를 모르는 상태에서 샘플링을 통해 추정하는 Implicit Model로 분류할