[게임 속 기술 이야기] 한 발 앞선 인공지능의 시작! 넷마블 게임과 AI의 만남

인공지능(이하 AI)은 집, 자동차, 교육 환경 등 우리 생활 곳곳에서 이전까지는 상상하지 못했던 새로운 삶을 열어주는 계기가 되는데요. 이 AI 기술은 게임 분야에서도 빠질 수 없는 정보기술로 자리매김했습니다. 기술과 문화를 선도하는 기업, 넷마블 역시 지속해서 AI 연구개발 중이며, 음성 인식, 컴퓨터 그래픽스, 컴퓨터 비전 등 여러 분야에서 국제적인 성과를 거두며 많은 활약을 하고 있는데요.

그렇다면 게임과 AI의 만남을 살펴보기에 앞서 AI란 무엇인지부터 알아볼까요? AI는 인공지능을 다루는 정보 기술을 포괄적으로 말하는데요. 우리가 이미 스마트폰을 사용하면서 자주 접하는 음성 인식 기술을 비롯해 영상의 정보를 이해하는 컴퓨터 비전 분야, 컴퓨터가 인간의 언어를 이해하도록 학습하는 자연어 처리 분야, 다이나믹한 환경에서 이상적인 해법을 찾아내는 강화학습 등 다양한 세부 분야로 나뉩니다. 그외에도 다양한 AI 분야가 있지만 넷마블에선 현재 음성, 자연어처리, 강화학습, 비전, 그래픽스 등 분야에 집중하고 있습니다.

1. 음성인식 – Robust Keyword Spotting via Recycle-Pooling for Mobile Game

구글의 ‘오케이 구글’, 애플의 ‘시리야’, 갤럭시의 ‘하이 빅스비’처럼 우리에게 친숙한 음성 인식 AI 기술을 넷마블 게임에서도 만날 수 있다는 사실 알고 계셨나요? 현재 <A3: 스틸얼라이브>에서는 모바일 게임 최초로 ‘모니카’라는 키워드 인식을 통해 자동 사냥, 상점 진입 등 음성 인터페이스를 이용해 여러 콘텐츠를 즐길수 있는데요. 국내에서는 드물게 음성 인식 분야 세계 최고 양대 학회인 인터스피치(INTERSPEECH.2019)와 아이캐스프(IEEE ICASSP.2020) 학회에서 모니카 키워드와 게임 커맨드 인식 기술을 발표 했습니다. 이에 그치지 않고 모바일 게임 특성에 맞춰 네트워크가 아닌 디바이스 자체에서 실시간 음성 인식 기술 연구에 박차를 가하고 있는데요. 조만간 더 많은 게임에서 한층 더 성장한 음성 인식 기술을 이용할수 있습니다.

2. 페이셜 에니메이션- Multi-Task-Driven Facial Animation

넷마블과 함께하는 두 번째 AI 기술은 바로 ‘페이셜 애니메이션’입니다. 게임을 하다 보면 주인공들이 대화하는 멋있는 애니메이션 씬을 종종 볼 수 있는데요. 일반적인 애니메이션 씬은 단순히 캐릭터가 입을 벙긋거리는 것에서 그치지만, ‘페이셜 애니메이션’이 더해진다면 조금 달라집니다. 대사에 맞춰 얼굴 근육이 자동으로 움직여 음성과 싱크가 딱 맞는 한층 더 자연스러운 표현이 가능한데요. 넷마블의 페이셜 애니메이션 기술은 컴퓨터 그래픽스 분야 세계 1위 학회인 시그래프(ACM SIGGRAPH 2019)에서 발표했습니다. 국내 게임사에서 두 번째로 시그래프에 발표한 사례여서 더욱 의미 있는 기술이기도 하죠.

▲ DensePose 로 사람의 3D 좌표로 매핑한 결과

3. 인공지능 – 덴스포즈 Dense Pose

넷마블의 인공지능 기술 분야에서 최근 주목받는 것은 딥러닝을 이용해 2D 이미지에서 사람을 검출한 후 인체의 3D 구조로 매핑해 다양한 포즈를 구하는 기술인 덴스포즈(DensePose)입니다. 넷마블은 덴스포즈(DensePose) 챌린지에 참여해 작은 해상도에서 피쳐맵(Feature Map)의 해상도가 낮은 점을 보완해 업샘플링(Up-Sampling: 해상도가 낮은 원본 이미지의 픽셀을 증가시켜 고해상도 이미지로 변환) 레이어를 촘촘히 쌓는 기술을 개발했는데요. 세계 3대 컴퓨터 비전 학회인 ECCV에서 주최한 ‘코코 챌린지(2018)’에서 최종 준우승 으로 기술력을 인정 받았습니다.

넷마블에서 연구개발중인 다양한 AI 기술은 게임의 몰입감을 높이고 더 좋은 게임 퀄리티를 만들기 끊임없이 개선될 전망입니다. 향후 다양한 게임 분야에 AI 기술력이 접목되면서 게임 개발에 효율성을 높이고 이용자의 편의를 위해 발전하는 게임 문화 사업의 미래가 될 것으로 기대됩니다.