Post

[DL Book] 11.2. Default Baseline Models

성능 평가 지표를 선택했다면, 다음으로 할 일은 최대한 빠르게 end-to-end 시스템을 구성하는 것이다. 이는 모델의 성능을 비교할 때 어떤 값을 기준으로 삼을지 정하기 위함이다.

해결하고자 하는 문제가 단순하다면 간단한 머신러닝 알고리즘을 베이스라인 모델로 사용할 수도 있다. 물론 이미지 인식, 음석 인식 등의 복잡한 문제를 풀고자 한다면 딥러닝 모델을 베이스라인으로 사용해야 한다.

어떤 모델을 사용할 것인가?고정된 크기의 벡터 데이터 → MLP
공간적 특징을 가진 데이터 → CNN
시간적 순서를 가진 데이터 → RNN, GRU, LSTM
etc…
어떤 최적화 알고리즘을 사용할 것인가?SGD + Momentum + Learning Rate Decay
Adam
etc…
어떤 정칙화 전략을 사용할 것인가?Early Stopping
Dropout
Batch Normalization
etc…
어떤 학습 전략을 사용할 것인가?지도학습, 준지도 학습, 비지도 학습 등…

사전 학습된 모델 사용하기

과거에 이미 비슷한 분야의 연구가 진행되었다면, 그 연구의 결과물들을 활용할 수도 있다. 물체 분류(Image Classification)와 같은 대표적인 분야의 유명한 솔루션들은 학습 완료된 상태의 모델이 공개되어 있다. 이것을 베이스라인으로 삼는 것도 좋다.


💡 자세히 읽기
AI는 빠르게 발전하는 분야이므로, 이 챕터에서 다루지 않은 베이스라인 알고리즘이 미래에 등장할 수도 있다.




포스트가 마음에 드셨다면, 좋아요를 남겨주세요!

This post is licensed under CC BY 4.0 by the author.