논문 참고문헌
Research Article

설명가능한 기계학습을 이용한 베스트셀러 예측과 영향요인 분석

이승필, 박은일, 류두진

사회평론 전무이사
성균관대학교
성균관대학교

발행: 2025년 1월 · 54권 1호 · pp. 81-108

DOI: https://doi.org/10.17287/kmr.2025.54.1.81

본문 보기 PDF

초록

온라인 서점의 방대한 데이터를 기반으로 판매량이나 베스트셀러를 예측하는 연구는 판매기록과 리뷰 등 출판 이후 자료에 의존하므로, 신간도서에 대해 베스트셀러 예측을 하기 어려운 콜드 스타트 문제를 가진다. 본 연구에서는 온라인 서점의 문학 장르에서 신간도서의 메타 데이터를 사용해 베스트셀러를 예측하는 기계학습 모형을 구현하였으며, LightGBM 모형이 가장 우수한 성능을 보였다. 특성 중요도 기법과 SHAP방법으로 저자 빈도, 출판사 빈도, 카테고리 빈도, 가격, 출판 월이 베스트셀러 예측에 영향을 미치는 요소임을 확인하였다. 연구 결과는 콜드 스타트 문제 해결에 기여하고, 온라인 서점이 신간도서의 성공 가능성을 예측하며 마케팅 전략을 수립하는 데 함의를 제공한다.
키워드: 기계학습베스트셀러설명가능한 인공지능온라인 서점예측