본문 바로가기
바둑들 궁시렁 궁시렁

[이세돌 vs 알파고 3국] 알파고는 몇 수 부터 유리했을까?

by 멀리던 2022. 7. 6.
728x90

알파고는 심층망+몬테카를로 알고리즘으로 만들어졌다.

 

아주 간단하게 설명하면 심층망은 다음 착수지점의 후보를 뽑아주는 역할이고

 

몬테카를로는 심층망에서 뽑아준 착수지점을 기준으로 앞으로 흑,백 간의 착수를 랜덤하게 하여 value값 (=이길확률)을 나타내준다.

 

그 value값이 알파고 또는 이세돌이 착수된 시점을 기준으로 이길 확률인 것이다.

 

 

 

 

 

지금 시중에 나와있는 바둑프로그램 중에 가장 강력한 프로그램은 제니스, 크레이지 스톤, 은성위기, 돌바람인데

 

4가지 프로그램 모두 성능이 거의 비슷하다. 프로기사와 4점 접바둑을 둘 수 있는 기력.

 

기력이 비슷할 수 밖에 없다. 이 4가지 프로그램 모두 몬테카를로 트리서치 알고리즘을 쓰고 있기 때문이지.

 

그래서 특정한 착수시점에서 흑 또는 백의 이길확률은 몬테카를로 트리서치 알고리즘을 쓰는 프로그램이라면

 

같은 착수를 기준으로 비슷한 value값이 나오게 된다.

 

 

 

 

 

 

그래서 이세돌과 알파고 3국에서 과연 알파고는 몇 수 째부터 유리하다고 계산서가 나오기 시작했는지

 

알아보았다.

 

 

 

 

 

일단 어제 3국의 실전진행.

 

 

 

 

 

 

이 수순대로 젠5 프로그램에 입력하였더니

 

 

 

 

 

 

흑의 이길 확률은 이미 50% 밑으로 떨어지고 있었다.

 

이세돌은 컴퓨터가 예측했던 대로 J15의 곳으로 중앙을 밀어올렸는데

 

이럴 경우 이세돌이 이길 확률은 이미 50%가 아닌 48%로 떨어지고 있었다.

 

 

 

옆의 122592라는 숫자는 흑이 그 곳을 착수했을 때 컴퓨터가 몬테카를로 알고리즘을 통해 일정부분에서 랜덤하게 착수하여 대국을 진행시킨 횟수를 뜻한다.

 

그러니까 흑이 J15의 곳에 둘 확률이 가장 높고,

 

J15에 두었을 경우 흑과 백이 유력한 곳에 랜덤으로 12만 2592번을 두었을 때 흑이 이길 확률이 48%라는 것이다...

 

 

 

 

 

 

 

 

 

실전진행대로 수순을 조금만 더 진행시켜보면

 

 

 

 

 

알파고는 젠과 같이 실제로 H13에 두었는데

 

이길 확률은 이미 54%가 되고 있었다.

 

 

실제로 프로기사들은 모두들 좌상귀에서의 흑과 백의 공방에서 흑이 망해서 바둑이 어려웠다고 말하고 있다.

 

인간은 이렇게 수치화 할 수 없게 감으로 말했지만

 

컴퓨터는 이렇게 매 착수마다 이길 확률을 구체적인 수치로 나타내고 있다.

 

 

 

 

 

 

한줄요약) 이세돌의 수읽기도 몬테카를로를 넘어서기엔 역부족이다.

728x90