[인공지능] '바둑의 신' 알파고, 장기·체스도 석권 로봇AI

alpa.jpg » 바둑 인공지능 ‘알파고 제로’의 개량판 ‘알파 제로’가 장기와 체스에서도 최고의 실력을 습득했다. 딥마인드 제공

 

장기는 2시간, 체스는 4시간만에 '신의 경지'에

 

구글 딥마인드의 바둑 인공지능(AI) '알파고'가 쇼기(일본 장기)와 체스에서도 세계 최고수 자리에 올랐다.
딥마인드는 기보 학습 없이 스스로 바둑의 신 경지에 오른 '알파고 제로'의 개량판 '알파 제로'가 독학으로 불과 몇시간만에 장기와 체스에서도 세계 최강 실력을 습득하는 데 성공했다고  발표했다.
미 코넬대가 운영하는 온라인 공개 논문저장소 <아카이브>(arXiv)에 발표한 논문 '범용 강화학습 알고리즘으로 체스와 쇼기 정복하기(Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm)'에 따르면 딥마인드 연구진은 '알파 제로'에 장기와 체스의 기본 규칙만 가르친 후 자율학습을 하도록 했다. 학습 방식은 강화학습이다. 그 결과 장기는 2시간, 체스는 4시간, 바둑은 24시간만에 각각 현재의 최고수를 물리쳤다.
이는 올해 세계 컴퓨터 장기선수권대회에서 우승한 장기 소프트웨어 '엘모', 지난해 체스 세계대회를 제패한 '스톡피시', 바둑 최고수에 오른 '알파고 제로'와 실력을 비교한 결과다.

alpha2.jpg » 알파제로는 체스 강화학습 4시간만에 세계 최고수 실력을 쌓았다. 픽사베이

 

딥마인드는 알파 제로는 바둑 게임용으로 개발한 알파고가 범용 게임 인공지능으로 진화했음을 뜻한다고 밝혔다. 이번 사례는 인공지능이 특정 분야를 넘어 난치병 원인 규명이나 신소재 개발 등 다양한 분야에 응용할 수 있음을 보여주는 것으로 풀이된다.

 

출처

https://arxiv.org/abs/1712.01815

https://www.technologyreview.com/s/609736/alpha-zeros-alien-chess-shows-the-power-and-the-peculiarity-of-ai/

http://www.kurzweilai.net/alphazeros-alien-superhuman-level-program-masters-chess-in-24-hours-with-no-domain-knowledge

 

http://www.sciencealert.com/it-took-4-hours-google-s-ai-world-s-best-chess-player-deepmind-alphazero?

https://futurism.com/4-hours-googles-ai-mastered-chess-knowledge-history/

알파고 제로

https://deepmind.com/blog/alphago-zero-learning-scratch/


곽노필 한겨레신문 선임기자 nopil@hani.co.kr
페이스북 페이지 '미래가 궁금해'
트위터 '곽노필의 미래창'
TAG

Leave Comments


profile한겨레신문 선임기자. 미래의 창을 여는 흥미롭고 유용한 정보 곳간. 오늘 속에서 미래의 씨앗을 찾고, 선호하는 미래를 생각해봅니다. 광고, 비속어, 욕설 등이 포함된 댓글 등은 사양합니다.