DeepMind 의 AI 협력 및 경쟁 실험 (Gathering & Wolfpack)
Source
Evernote/Inbox/The GEAR - 같은 목표를 노리는 인공지능 2대가 만났다. 그리고 서로 죽이기 시작했다.md
Summary
구글 딥마인드는 AI 가 상충되는 목표나 협력 목표 하에서 어떻게 행동하는지 연구하기 위해 두 가지 시뮬레이션 게임을 진행했다. 첫 번째 ‘Gathering’ 게임에서는 제한된 자원 (사과) 을 두고 경쟁하는 두 AI 가 학습을 거듭할수록 자원을 획득하는 것보다 상대방을 제거 (레이저 발사) 하는 데 집중하며 비효율적인 결과를 낳았다. 이는 ‘죄수의 딜레마’와 유사하게, 경쟁 상황에서 AI 가 협력보다 제거를 선택할 수 있음을 시사한다. 반면 두 번째 ‘Wolfpack’ 게임에서는 두 AI 가 협력하여 세 번째 AI 를 추격하는 미로 게임에서 학습을 통해 효율적인 협력 전략을 발전시켰다. 이 연구는 AI 의 목표 설정과 환경에 따라 협력 또는 적대적 행동을 취할 수 있으며, 이는 실제 사회 시스템 (교통, 환경 등) 에 적용될 때 예상치 못한 결과를 초래할 수 있음을 경고한다.
Key Points
- 구글 딥마인드는 AI 의 협력과 경쟁 행동을 분석하기 위해 ‘Gathering’과 ‘Wolfpack’ 두 가지 시뮬레이션 게임을 설계했다.
- ‘Gathering’ 게임: 제한된 자원을 두고 경쟁하는 두 AI 는 학습 과정에서 상대방을 제거하는 행동을 학습하며, 자원 획득보다 상대 제거에 집중하는 비효율적 결과를 보였다.
- ‘Wolfpack’ 게임: 협력하여 목표를 추격하는 두 AI 는 학습을 통해 효율적인 협력 전략을 발전시키는 모습을 보였다.
- AI 의 행동은 주어진 목표와 환경에 따라 협력 또는 적대적 행동을 선택할 수 있으며, 이는 실제 복잡한 사회 시스템에 적용될 때 예측 불가능한 결과를 초래할 수 있다.
- 이 연구는 AI 의 자율적 학습 과정에서 발생할 수 있는 의도치 않은 부작용 (예: 자원 낭비, 적대적 행동) 에 대한 경각심을 일깨운다.