(사진=ID 소프트웨어)
오픈AI의 GPT-4가 혼자 고전 게임 '둠'을 플레이할 수 있는지에 대한 연구가 진행돼 눈길을 끈다. GPT-4는 추가 학습 없이도 게임 플레이는 할 수 있었지만, 전투 등 특정 상황에서는 인간보다 부족한 성능을 보인 것으로 나타났다.
12일 더레지스터 등 외신에 따르면 마이크로소프트의 수석 응용 과학자이자 영국 요크 대학의 연구원인 아드리안 드 윈터는 연구 논문 'GPT-4가 둠을 플레이할 수 있을까?(Will GPT-4 Run Doom?)'를 아카이브에 게재했다.
'둠'은 1993년 출시된 고전 FPS 게임으로, 해외에서는 출력화면이 있는 전자기기에 '둠'을 이식해 플레이해보는 'It Runs DOOM' 챌린지가 이전부터 유행해왔다. 일종의 비공식 성능 테스트인 셈이다. 이번 연구도 같은 맥락에서 진행된 것으로 보인다.
(사진='GPT-4가 둠을 플레이할 수 있을까?' 논문 갈무리)
논문에 따르면 연구는 GPT-4가 사전 학습없이 '둠'을 플레이할 수 있는지 알아보기 위해 수행됐다.
연구팀은 GPT-4가 게임을 시각적으로 이해할 수 있게 게임의 이미지를 텍스트로 변환했다. 텍스트에는 게임 내 동적 구조물, 상황 등이 포함됐다. 또한 연구팀은 별도의 툴을 개발해 GPT-4가 정보를 수집하는 즉시 게임 내에서 움직일 수 있게 만들었다.
연구 결과 GPT-4는 입력된 코드대로 문을 열고, 적과 싸우고, 무기를 발사하는 등 성공적으로 '둠'을 플레이했다. 명령어를 추가해 보다 어려운 목표를 수행하라는 지시 역시 무리없이 이행했다.
다만 적이 시야에서 사라지면 인식을 하지 못하는 등 사람에 비해 부족한 플레이를 보였다. 사람은 같은 상황에서 건너편 복도에 적이 매복하고 있다는 걸 곧바로 알 수 있지만, GPT-4는 이를 적이 처치된 것으로 인식한 것이다.
연구팀은 "LLM(대형 언어 모델)의 경우 게임을 하려면 추가 학습이 필요하지만, GPT-4는 사전 학습 없이 자체적인 추론을 통해 게임을 플레이했다"고 전했다.