[추천시스템 논문 리뷰] Auto-Encoding Variational Bayes
Significance 사후확률이 Intractable한 경우에도 작동하는 확률적 변분추론 알고리즘과 학습 알고리즘을 제안한다. Scenario ${\bf X}={\bf{x}^{(i)}}^N_{i=1}$인 데이터셋 $\bf X$가 존재하며, 이것은 $N$개의 독립동일분포 샘플 $\bf x$로 구성된다. 각 데이터포인트 $\bf x...
Significance 사후확률이 Intractable한 경우에도 작동하는 확률적 변분추론 알고리즘과 학습 알고리즘을 제안한다. Scenario ${\bf X}={\bf{x}^{(i)}}^N_{i=1}$인 데이터셋 $\bf X$가 존재하며, 이것은 $N$개의 독립동일분포 샘플 $\bf x$로 구성된다. 각 데이터포인트 $\bf x...
1. Introduction CTR 예측 태스크는 크게 두 가지로 나눌 수 있다. Traditional Method: Logistic Regression 등 및 Factorization Machine 등. 딥러닝 기반 기법: DeepFM, NeuMF 등 현재 SOTA인 모든 방법들은 backpropagation과 SGD를 통해 학습한다...
Background 온라인 컨텐츠 플랫폼에서 추천 시스템(Recommender System)은 사용자 만족도를 끌어올리고 매출을 증대시키는 데에 중요한 역할을 한다. 추천의 품질을 높이기 위해, 컨텐츠의 Feature 데이터를 추천에 이용하는 연구(Multi-Model Recomendation)가 활발히 진행되고 있다. Problem Stateme...
Background 2020년대부터는 SNS 시장에 숏폼 컨텐츠가 급부상하며, 짧고 강한 자극에 말초신경이 절여진 우리의 시간을 삭제하고 있다. 숏폼 콘텐츠의 주요 성공 요인 중에서 단연 돋보이는 것은 바로 헤어나올 수 없는 마성의 추천 알고리즘이다. 숏폼 컨텐츠의 원조이자 선두주자인 틱톡(TikTok)의 모회사 바이트댄스(ByteDance)에서는 ...
Prerequisites Factorization Machines Context Factorization Machine(2010)이 선형 모델과 Matrix Factorization의 결합이라면, Wide&Deep(2016)의 경우는 선형 모델과 딥러닝의 결합이라고 할 수 있다. 이후 Wide&Deep의 컨셉을 계승...
Prerequisites Support Vector Machines Matrix Factorization for Recommender Systems Contribution SVM과 같이 General Predictor로 사용될 수 있는 추천 모델을 발표한다. FM은 (MF계열 알고리즘과 다르게) General Predictor 이다...
의사결정나무(Decision Tree)는 1984년에 Leo Brieman의 논문에서 첫 등장하였다. 오랜 역사를 자랑하는 알고리즘이지만 의사결정나무는 2022년 기준 오늘날에도 많은 문제해결을 위해 사용되고 있으며, Kaggle 등의 데이터분석 대회에서 최상위권을 휩쓰는 앙상블 기법을 기반으로 한 모델(e.g. Random Forest)들의 뼈대가 ...
디지털 서비스의 개인화에 대한 연구가 아직 무르익지 않았던 2006년, 넷플릭스는 사용자들의 영화 선호도 데이터를 기반으로 추천 시스템 공모전(Netflix Prize)을 열었다. 이 대회는 현대의 AI 공모전의 조상격이 되는 것으로, 최종 우승은 여후다 코렌(Yehuda Koren), 로버트 벨(Robert Bell)과 크리스 볼린스키(Chris V...
머신러닝 시스템이 잘 작동하지 않는 원인을 파악하는 것은 어려운 작업이다. 사실, 머신러닝을 통한 문제 해결 자체가, 인간이 쉽게 포착하지 못하는 부분까지 알고리즘에게 맡기는 것이 의의이기에, 인간의 눈으로 무엇이 잘못되었는지 알기 어려운 것은 당연하다. 머신러닝 시스템의 디버깅에는 크게 두 가지의 난점이 있다. 주어진 입력값에 대해 어떤 출력...
대부분의 딥러닝 알고리즘은 학습 알고리즘으로는 알아낼 수 없는 초매개변수를 동반한다. 초매개변수들을 어떻게 설정하느냐에 따라 모델의 성능은 천차만별이기에, 이를 올바르게 설정하는 것이 중요하다. 초매개변수는 수동으로 설정하거나 자동 탐색을 통해 찾아낼 수 있다. 전자는 알고리즘에 대한 수학적 이해가 필요하며, 후자는 비교적 이해가 부족해도 진행할 수...