알파고의 바둑 이해와 학습 방식

Source

  • Evernote/IFTTT Feedly/알파고는 어떻게 바둑을 둘까.md

Summary

본문은 알파고와 이세돌 9단 대결을 배경으로 바둑의 규칙(중국 규칙), 역사적 패러다임 변화(힘바둑→구조주의→신포석), 그리고 바둑 고수가 갖추어야 할 요소(수읽기, 감각, 평정심)를 설명한다. 알파고는 16만 건의 기보 학습을 통해 인간의 ‘감각’과 ‘모양’ 판단을 모방하여 사람처럼 바둑을 두는 능력을 갖추었으며, 몬테카를로 트리 서치(MCTS)를 기반으로 한 확률적 탐색 방식을 사용한다.

Key Points

  • 알파고-이세돌 대결은 중국 규칙(돌 수 세기)으로 진행되며, 알파고는 중국 규칙으로 학습되어 일본 규칙에서는 오류가 발생할 수 있다.
  • 바둑의 역사적 패러다임은 부분적 전투를 중시하던 ‘힘바둑’에서 전체 구조와 효율을 중시하는 ‘구조주의’, 그리고 중앙 세력과 두터움을 중시하는 ‘신포석’으로 진화했다.
  • 바둑 실력은 정확한 시나리오 예측인 ‘수읽기’, 형태에 대한 직관인 ‘감각’, 그리고 감정적 흔들림 없는 ‘평정심’의 조합으로 구성된다.
  • 알파고는 방대한 기보 학습을 통해 인간의 모양 감각을 학습했으며, 이는 인공지능이 튜링 테스트를 통과한 사례로 평가받는다.
  • 알파고는 모든 경우의 수를 계산하는 대신, 몬테카를로 트리 서치(MCTS)를 통해 일부 경로를 무작위 탐색하여 승률을 추정하는 방식을 사용한다.