[AI] 인공지능이 예측한 러시아월드컵 로봇AI

w1.jpg » 2018 러시아 월드컵 공인구. 위키미디어 코먼스

 

베팅업체들은 브라질, 인공지능은 스페인 첫손 꼽아

 

월드컵때만 되면 내로라하는 전문가, 투자기관, 도박사들이 저마다 우승팀 예측 결과를 내놓는다. 전통적으로 널리 쓰여온 것은 베팅업체들이 내놓는 예측이다. 이들은 그동안의 경기 자료를 토대로, 가능한 모든 대진표를 만들어 정량화하는 통계 기법을 활용해 우승팀을 예측한다. 이번에 베팅업체 26곳이 내놓은 결과들을 종합하면 올해의 우승팀은 브라질이 확률 16.6%로 가장 높게 나왔다. 이어 독일(12.8 %)과 스페인(12.5 %)이 우승 2, 3 순위로 각각 꼽혔다.
그러나 기존 통계기법은 축구에 작용하는 다양한 변수들을 다 담을 수 없다는 한계가 있다. 이에 따라 최근엔 인공지능 연구자들이 통계 기법의 한계를 뛰어넘은 머신러닝 기법을 개발해 예측에 활용하고 있다. 최근 독일의 도르트문트공대와 뮌헨공대, 벨기에 겐트대 연구자들이 머신러닝 기법으로 러시아 월드컵을 예측한 논문을 발표했다. 결론은 스페인의 우승 가능성이 가장 높다는 것이다. 연구진은 그러나 독일이 8강전에 진출한다면 독일의 우승 가능성이 가장 높다고 밝혔다. 독일과 스페인이 준결승에서 만날 경우 독일이 이길 확률이 더 높게 나왔기 때문이다. 이번 월드컵에서 있을 수 있는 토너먼트를 10만번 시뮬레이션한 결과다.
연구진이 예측에 활용한 방법은 머신러닝과 기존 통계를 결합한 `무작위숲'(랜덤 포리스트, Random Forest) 접근법이다. 무작위숲이란 여러 개의 의사결정 나무들이 무작위하게 늘어서 있는 숲이라는 뜻으로, 기존 데이터분석법의 함정이나 오류를 피할 수 있는 기법으로 주목받고 있다. 의사결정 나무 모델에선 일련의 학습 데이터를 토대로 모든 가지별로 결과를 계산한다. 그런데 이 과정을 반복하다 보면 나중에 가선 결과치가 크게 왜곡되는 과적합(오버피팅) 문제가 생긴다. 연구진이 개발한 무작위숲 방식은 모든 가지에서 결과를 계산하는 대신 임의로 선정한 가지의 결과를 계산한다. 이 과정을 반복해 얻은 결과들을 평균한 것이 최종 결과값이 된다. <MIT 테크놀로지 리뷰>는 "이 방식은 과적합 문제를  피하고 어떤 요인이 가장 중요한 역할을 했는지 알 수 있게 해주는 장점이 있다"고 평가한다.

w9.jpg » 인공지능이 예측한 참가국들의 러시아 월드컵 경기 확률.

 

스페인 우승의 걸림돌은 독일의 8강 진출

 

연구진은 결과에 영향을 줄 수 있는 요인들을 광범위하게 살폈다. 각 나라의 GDP, 인구, 피파(FIFA) 랭킹, 선수들의 나이, 챔피언리그 소속 선수 보유 현황, 홈 어드밴티지 여부 등을 두루 살폈다. 베팅업체를 비롯한 예측기관들의 랭킹도 포함시켰다.  그 결과 스페인의 우승 확률이 17.8%로 가장 높았다. 이어 독일(17.1%)과 브라질(12.3%)이 뒤를 이었다. 가장 영향력 있는 요인은 역시 베팅업체를 비롯한 기관들의 예측이었다. GDP나 챔피언리그 보유 선수 숫자도 의미있는 요인이었다. 반면 인구 수나 코치의 국적 등은 별 영향이 없었다.ㅣ
그러나 이 예측엔 큰 변수가 하나 있다. 그것은 예선 이후 토너먼트 대진표가 어떻게 짜여지느냐는 것이다. 연구진은 만약 독일이 조예선 경기를 통과하면 16강전에서 강한 상대를 만날 가능성이 더 높다고 예측했다. 반면 스페인은 16강전에서 강한 상대를 만날 가능성이 낮다. 이에 따라 스페인의 8강 진출 확률은 73%로 독일의 58%보다 높게 나왔다.

연구진은 "두 팀이 모두 8강전에 진출할 경우 두 팀의 우승 확률은 엇비슷해진다"고 밝혔다. 다만 독일이 16강전에서 탈락할 가능성이 상대적으로 높기 때문에 전체적으로는 스페인이 다소 유리할 것으로 내다봤다.

w3.JPG » 예선 8개조의 16강 진출팀 예측 결과.

 

가장 개연성 높은 토너먼트에선 독일이 우승

무작위숲은 있을 수 있는 모든 토너먼트를 시뮬레이션할 수 있는데, 이를 돌려보면 결과가 또 달라진다. 연구진은 전체 토너먼트를 10만번 시뮬레이션했다. 가장 개연성이 높은 토너먼트를 적용해 보니, 스페인이 아닌 독일이 월드컵을 거머쥐는 것으로 나왔다. 물론 수많은 순열조합 중에서 이 토너먼트 구조가 실현될 확률은 10만분의 1.5%로 극히 낮다.

w4.JPG » 가장 개연성이 높게 나온 토너먼트 구조도. 브라질과 독일이 결승전에서 맞붙는 걸로 예측됐다.

 

한국팀의 16강 확률은 18%...우승 확률은 0%

 

한국팀에 대해선 어떤 예측이 나왔을까? 독일 스웨덴 멕시코와 함께 F조에 소속돼 있는 한국의 16강 진출 확률은 17.9%로 나왔다. 32개 참가국 중 29번째다. 그럼 우승확률은? 겸연쩍게도 0%다. 한국과 함께 우승 확률이 0%로 나온 나라는 일본, 파나마, 사우디아라비아까지 모두 합쳐 4개국이다. F조에서 16강전에 진출할 나라로는 스웨덴과 독일이 꼽혔다. 16강전에서 스웨덴은 브라질과, 독일은 스위스와 만날 것으로 예상됐다.
체스나 바둑, 질병진단 등 속속 분야를 넓혀가며 인간을 뛰어넘는 능력을 발휘하고 있는 인공지능이 내놓은 러시아 월드컵 예측은 얼마나 적중할까? 하지만 공은 둥글다.

 

출처
https://arxiv.org/abs/1806.03208
https://www.technologyreview.com/s/611397/machine-learning-predicts-world-cup-winner/
https://theconversation.com/could-australia-win-really-the-science-of-predicting-the-world-cup-champion-98082?
무작위숲의 원리
http://sams.epaiai.com/220979751089

TAG

Leave Comments


profile한겨레신문 선임기자. 미래의 창을 여는 흥미롭고 유용한 정보 곳간. 오늘 속에서 미래의 씨앗을 찾고, 선호하는 미래를 생각해봅니다. 광고, 비속어, 욕설 등이 포함된 댓글 등은 사양합니다. 

Recent Trackback