본문 바로가기
사회 이슈

알파고의 업그레이드 알파고 제로

by 미니송 2017. 10. 20.

알파고의 업그레이드 알파고 제로





2017/08/16 - [IT] - 인공지능과 딥러닝에 대해


이번 포스팅은 알파고 제로에 대해 하겠습니다. 알파고와 이세돌의 대국에 이어 인공지능 프로그램 알파고 제로가 나왔습니다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO)와 데이비드 실버 수석과학자 등 연구진은 지난해 바둑기사 이세돌 9단과 지난 5월 중국의 커제 9단을 제압한 인공지능 알파고를 능가한 알파고 제로를 개발했다고 국제학술지 네이처에 18일 공개했습니다.


알파고 제로는 바둑 최고수를 모조리 꺾은 인공지능(AI) 프로그램알파고를 능가하는 새 버전 이라고 합니다. 알파고는 이전의 대국들을 학습하여서 바둑을 배우게 되었습니다. 이세돌과 대국 당시 알파고는 인간 바둑기사가 둔 기보 16만 건을 학습했습니다.


알파고는 지난해 3월 한국 바둑 고수 이세돌 9단과의 대국에서 41패로 승리하면서 AI 열풍을 불러 온 AI 프로그램이다. 지난 5월에는 이보다 한층 강해진 알파고 새 버전이 세계 2관왕 커제 9단과의 대결에서 3전 전승을 하였습니다.


하지만 알파고 제로는 이전 바둑 대국을 학습하여 만들어 진 것이 아닙니다.


이번에 공개한 알파고 제로는 인간 바둑기사의 사고 방식이 담겨 있는 바둑 기보를 전혀 학습하지 않았다는 것이 특징입니다.


오로지 백지 상태에서 바둑을 두며 상대를 탐색하고 유리한 형세를 알아냈습니다. 어떻게 보면 바둑 자체를 학습했다고 볼 수 있으며 바둑이 어떻게 돌아가는지를 깨우쳤다고 생각하시면 될 것 같습니다.


알파고 제로는 490만 번 자기와의 대국을 통해 반복 훈련을 거쳤습니다. 딥마인드는 논문에서 알파고 제로가 3시간 만에 바둑 초심자처럼 상대 돌을 잡고 19시간 만에 바둑의 사활을 이해하며 70시간 만에 인간 바둑기사 수준에 이르렀다고 공개했습니다.


또한, 다음 수를 두는 데까지 평균 0.4초를 썼습니다. AI의 두뇌 역할을 하는 텐서플로프로세스유닛(TPU)도 알파고 리가 48개를 쓴 데 비해 알파고 제로는 고작 4개만 사용했다. 알고리즘을 대폭 간소화하면서 계산 부담을 줄였습니다.


이제 인공지능이 더 빠른 속도로 발전하고 있다는 것이 느껴집니다. 알파고 제로가 이전의 대국을 학습하지 않았으며 그러고도 바둑을 배웠다는 사실입니다. 인간은 수명에 한계가 있고 집중을 할 수 있는 시간이 한계가 있습니다.


하지만 알파고 제로와 같이 컴퓨터가 학습을 할 수 있는 방법을 배운다면 정말 얼마 되지 않는 시간으로도 무언가를 배울 수 있다는 것입니다. 앞으로 SF영화에서만 보던 장면이 나올 날이 멀지 않았다는 것을 느낍니다.

댓글