판후이 학습효과…알파고, 5개월새 더 강해졌다

  • 스포츠동아
  • 입력 2016년 3월 10일 05시 45분


이세돌 9단. 사진제공|구글
이세돌 9단. 사진제공|구글
■ 인공지능의 습격|‘인간 최고수’ 이세돌 꺾은 알파고

세기의 대결 첫 번째 대국이 끝났다. 인공지능(AI)의 승리였다. 이세돌의 일방적 승리일 거란 예상과는 달리 초반부터 팽팽한기싸움이 계속됐고, 결국 구글 딥마인드의 알파고 손이 올라갔다. 이번 대국은 인공지능과 인간의 두뇌 대결에서 인공지능이 승리한 역사적 기록의 한 페이지로 남게 됐다. 인공지능은 컴퓨터 프로그램을 통해 인간의 지각과 추론 능력 등을 실현하는 기술이다. 자율주행차량 등 차세대 서비스들이 가진 문제를 해결할 수 있는 열쇠로, 구글을 포함한 세계적 정보기술(IT) 기업들이 치열한 경쟁을 벌이고 있는 분야다. 이번 승리로 인공지능 분야는 더욱 주목받을 것으로 보인다.

반복적 바둑 경험 통해 스스로 진화
시행착오 프로세스로 새 전략 학습


그렇다면 알파고는 경우의 수가 우주에 존재하는 원자의 수보다 많다는 바둑에서 어떻게 최강의 프로기사를 상대로 승리를 거뒀을까. 무엇보다 지난해 10월 판후이 2단과의 대국이 진행된 지 불과 5개월 만에 이렇게 빠른 성장을 했을까. 해답은 스스로 학습한다는 데 있다. 이를 기계학습(머신러닝)이라고 부른다. 과거 체스 세계 챔피언을 꺾은 IBM의 슈퍼컴퓨터 ‘딥블루’는 데이터화 된 모든 경우의 수를 대입해 대결을 펼쳤다. 경우의 수가 무한대에 가까운 바둑에서는 이 방식이 통하지 않았다. 하지만 알파고의 경우 경험을 통해 스스로 학습하며 진화한다. 컴퓨터가 이처럼 빅데이터를 기반으로 스스로 학습하는 것을 머신러닝이라고 한다.

영화 ‘아이언맨’에 등장하는 인공지능 비서 ‘자비스’를 떠올리면 이해가 쉽다. 알파고는 특히 사람의 신경구조를 모방한 인공신경망에 기초해 스스로 학습하고 판단까지 하는 ‘딥 러닝’ 알고리즘을 기반으로 작동한다. 일정 양의 예상 또는 데이터를 프로그램화 해놓은 방식이 아닌, 반복적인 경험을 통해 데이터에 내재된 다양한 특징이나 행동의 확률적 빈도를 분석하고 학습하는 것이다. 구체적으론 ‘정책망’이라고 부르는 하나의 신경망이 바둑돌을 둘 수 있는 위치를 보고 확률이 높은 위치로 범위를 좁힌다. 그 후 ‘가치망’이라는 또 다른 신경망으로 각 위치의 승률을 계산한다.

여기에 인간의 직관까지 흉내낼 수 있는 수준에 올랐다는 것이 구글 측의 설명이다. 이길 가능성이 높은 위치로 범위를 좁힌 뒤 상대를 이길 수 있는 최적의 수를 찾는 인간의 방식과 유사한 셈이다. 하지만 알파고는 1000개가 넘는 중앙처리장치(CPU)와 170여개에 이르는 그래픽처리장치(GPU) 등 탄탄한 하드웨어의 지원을 받는 등 방대한 양의 데이터를 인간보다 더 빠르게 경험을 할 수 있다.

이번 승리의 비결은 결국 판후이 2단과의 대국 이후 많은 경험을 통한 빠른 학습에 있다. 판후이전 이전에는 전문가가 플레이하는 게임으로부터 3000만개의 움직임에 대해 신경망을 훈련했다. 또 자체 신경망 간에 수천만 회의 바둑을 두고, 강화 학습이라는 시행착오 프로세스를 사용해 연결고리를 조정함으로써 스스로 새로운 전략을 발견하는 법도 학습했다. 판후이와의 승부 이후에도 양질의 데이터를 입력해 수많은 자기 학습을 했고, 기력이 향상됐다는 것이 구글측의 설명이다. 결국 알파고는 24시간 가동되는 기보 학습과 자가 훈련 속에 5개월 전과는 전혀 다른 인공지능으로 발전한 셈이다.


이모저모

● 알파고의 개발사 구글 딥마인드의 데미스 하사비스 CEO는 승리 후 기자회견장에서 “오늘 대국에서 알파고는 매순간 한계치에 다다랐다. 오늘로서 알파고의 한계를 확인할 수 있었다. 전투적인 바둑 스타일로 알파고를 한계까지 몰아붙인 이세돌 9단에게 존경심을 표한다”고 말했다. 남은 네 판에 대해서는 “승리에 대해 전망하는 것은 쉽지 않다. 이세돌 9단이 새로운 시도를 할 것으로 예상된다”면서 “오늘처럼 흥미로운 대국을둘 수 있다면 (인공지능의 발전에) 큰 기여를 할 것으로 생각된다”고 말했다. 하사비스 CEO는 자신의 트위터에 “승리! 우리는 달에 착륙했다. 팀이 자랑스럽다. 어메이징한 이세돌에게 경의를 표한다”는 글을 남기기도 했다.

● 대국 전부터 알파고의 완승을 예측한 김진호 서울과학종합대학원 빅데이터 MBA 교수는 ‘알파고가 바둑을 모르면서도 알고 둔다’고 표현. 그는 “사실 사람들도 바둑을 감으로 둔다. ‘여기서 이렇게 두면 수(手)의 가치가 얼마고, 이길 확률이 얼마다’고 계산하기 어렵기 때문”이라며 “사람들이 전혀 못하는 계산을 알파고는 할 수 있다. 알파고는 ‘여기 두면 나한테 얼마나 유리하고 승률이 얼마가 될 것이다’를 판단한다. 그런 방법으로 수십 만번씩 두었을 때의 통계를 바탕으로 착수 지점을 찾기 때문에 유리하다”고 설명.

● 알파고는 영국 스타트업인 딥마인드가 개발했다. 딥마인드는 2014년 6억 달러에 미국 구글에 인수됐다. 국적이 모호하다고 볼 수도 있는 상황. 그런데 국기로 국적은 확인이 됐다. 이날 대국장에서 알파고는 영국 국기인 ‘유니언잭’과 함께 소개됐다.

김명근 기자 dionys@donga.com
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

지금 뜨는 뉴스