
[Model Merging]논문 리뷰 Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time
·
공부/논문리뷰
한글 제목: Model Soups: 여러 개의 Fine-Tuned 모델 가중치를 평균하여 성능 향상시키기1. 논문 소개 및 리뷰 목적Model Merging은 서로 다른 학습 과정에서 생성된 모델들의 가중치를 결합하여 새로운 모델을 만드는 방법입니다.이번 대학원에 들어와 맡은 과제가 Model Merging와 관련이 많기 때문에 Model Merging을 도와주는 툴킷인 mergekit에서 소개하는 논문을 하나씩 리뷰해 보고자 합니다.이 논문에서는 Model Soup이라는 새로운 기법을 제안하여, 여러 개의 Fine-Tuned 모델의 가중치를 평균(Averaging)함으로써 성능을 향상시키는 방법을 소개합니다. Model Soup는 추가적인 추론 비용 없이 성능을 개선할 수 있으며, 다양한 데이터셋과 모..