게임 아이템 구매 이력에 word2vec 적용 사례

Source

  • Evernote/Inbox/gimmesilver's blog.md

Summary

본 문서는 자연어 처리 알고리즘인 word2vec을 게임 아이템 구매 이력 데이터에 적용하여 아이템의 의미 벡터를 추출하고 분석하는 사례를 다룹니다. 엔씨소프트의 모바일 게임 ‘리니지 레드나이츠’ 유저의 구매 로그를 바탕으로 gensim 라이브러리를 사용해 아이템 벡터 모델을 생성했습니다. 분석 결과, 함께 구매되는 경향이 높은 아이템들(예: 마법 방어용 소환수와 물리 방어용 소환수) 간 유사도가 높게 산출되었으며, 벡터 연산을 통해 아이템의 속성(역할, 외형 등) 간 관계를 추론할 수 있음을 확인했습니다. 또한 PCA와 DBSCAN을 활용한 클러스터링을 통해 아이템 카테고리화를 시도했습니다.

Key Points

  • word2vec은 텍스트뿐만 아니라 텍스트와 유사한 구조를 가진 데이터(구매 이력 등)에도 적용 가능함
  • 유저별 구매 아이템 목록을 시퀀스로 변환하여 gensim을 통해 word2vec 모델 학습
  • 코사인 유사도 분석을 통해 실제 게임 내 전략적 연관성이 높은 아이템 쌍이 유사한 벡터로 표현됨을 확인
  • 벡터 연산(예: A - B + C = D)을 통해 아이템의 잠재적 속성(딜러/탱커, 인간형/비인간형 등) 간 관계를 추론 가능
  • PCA 차원 축소 및 DBSCAN 클러스터링을 통해 아이템 의미 벡터의 카테고리화 가능성 탐색