계속 업그레이드 되는 ‘가상 아이돌’, 의미심장한 연예계 트렌드
12월9일, Mnet에서 <AI 음악 프로젝트 다시 한번> 방송을 시작했다. “대중이 그리워하는 아티스트들의 발자취를 더듬어 보고, 그들의 목소리를 복원해 새로운 무대를 선보이는 것”이 기획 의도다. 프로그램은 고인의 음성 자료를 바탕으로 한 목소리 복원뿐만 아니라 페이스 에디팅 기술로 얼굴과 동작까지 재현한다. 1화에서는 그룹 ‘거북이’의 래퍼이자 프로듀서인 고(故) 터틀맨(본명 임성훈)을, 2화에서는 고 김현식을 소환했다. 내년 1월 신년 특집 4부작으로 방영될 SBS의 <세기의 대결! AI vs 인간> 첫 편은 모창 AI다. 1996년 세상을 떠난 김광석의 목소리가 2002년 발표된 김범수의 ‘보고 싶다’를 부른다. 사람들은 감동하거나 경악하거나 얼떨떨해한다. 이세돌과 알파고가 대결할 때까지만 해도 비일상적이고 흥미로운 이벤트 정도로 여겼던 인공지능(AI)은 이렇게 불쑥 우리 삶에 비집고 들어왔다. 그리움이나 친밀성 같은 ‘감정’을 공략하면서, 현실과 밀접하게 연동된 형태로.
“에스파는 나야, 둘이 될 수 없어.” 11월 데뷔한 SM의 신인 걸그룹 ‘에스파(aespa)’의 데뷔곡 ‘블랙 맘바(Mamba)’ 가사는 인터넷에서 수많은 패러디를 양산했다. 에스파의 세계관은 현실세계의 멤버와 가상세계의 아바타가 함께 존재하고, 이들이 중간지대인 디지털 세계에서 만나는 것이다. 멤버 개인을 본떠서 만든 아바타 ‘아이’(예를 들면 멤버 카리나의 아바타는 ‘아이카리나’다)가 또 다른 자아라는 설정이다. 에스파는 현실의 멤버 4명과 가상 아이돌 4명이 함께 활동하는 4인조이자 8인조인 그룹인데, 개인과 아바타가 결국 다른 층위의 한사람이기에 궁극적으로는 4인조인 셈이다.
낯선 개념과 세계관으로 보이지만, 일본 문화에 익숙한 독자는 이해하기 쉬울 것이다. 2007년 데뷔한 하쓰네 미쿠는 대표적인 가상 아이돌이다. 크립톤 퓨처 미디어사의 음성 합성 소프트웨어 보컬로이드의 캐릭터인 하쓰네 미쿠는 10년 넘게 웬만한 아이돌보다 큰 인기를 누리는 중이다. 홀로그램으로 콘서트를 열고, 각종 광고에 출연했다. 한국에도 사이버 가수 계보가 있다. 1997년 데뷔 직후 큰 인기를 얻었던 국내 1호 남성 사이버 가수 ‘아담’, 1호 여성 사이버 가수 ‘류시아’, 청소년 사이버 가수 ‘사이다(cyda)’…. 2001년 스타맥스미디어가 결성한 5인조 그룹 ‘나스카’는 컴퓨터그래픽으로 형상화한 사이버 가수 나스카와 함께 6인조 그룹으로 활동하는 것이 콘셉트로 에스파와 유사하다. 대부분 기술의 한계와 대중의 냉담한 반응에 부딪혀 오래 활동하지 못했다.
게임 LoL 속의 아이돌 ‘K/DA’
아바타를 포함한 걸그룹 ‘에스파’
꿈을 볼모로 착취를 정당화하고
노동 환경에는 무관심한 기획사들
인적 자원의 관리 부담 피하면서
변수 없이 철저히 통제할 수 있어
본격적으로 산업에 뛰어든 SM이
소속 가수를 잇달아 잃은 적 있고
팬들에게 관리 소홀을 책망받은
사실이 있음은 의미심장하다
성공적인 사례는 2018년 데뷔해 활동 중인 K/DA(사진)이다. 게임 <League of Legends(리그 오브 레전드, 이하 LoL)>의 캐릭터 기반 가상 아이돌인 K/DA는 게임 내에서 K팝 걸그룹이 콘셉트다. 각각의 캐릭터가 한국의 걸그룹 (G)I-DLE 멤버인 소연과 미연, 매디슨 비어, 자이라 번스와 특성과 목소리를 공유한다. 실제 아이돌의 행동, 표정이 모션 캡처로 가상 아이돌과 연결되고 가상 아이돌은 무대에서 게임 스킬을 재현하거나 구미호 꼬리 같은 외형을 그대로 드러낸다. 이 상호 작용 속에서 현실은 구체적으로 가상화되고, 가상은 절묘하게 현실화된다. 2018년 월드 챔피언십 결승전 무대에서는 증강현실을 이용, K/DA가 등장해 실제 가수들과 합동 공연을 했다. 무대 위에서 노래하는 ‘인간’은 4명이지만 퍼포먼스를 하는 가수는 8명이다. 무슨 말인지 이해가 잘 안 된다면 백문불여일견, 유튜브에 ‘2018 K/DA’를 검색해보길.
K/DA와 에스파는 새로운 층위의 가상 아이돌이다. 실존 인물이 없어야 ‘가상’이지만, 아바타는 본체인 실존 인물과 연결되면서 현실과 가상의 경계를 가로지른다. 내년 상반기 출시되는 NC소프트(이하 NC)의 K팝 엔터테인먼트 플랫폼 ‘유니버스(UNIVERSE)’는 이렇게 흐릿해지는 경계를 좀 더 일상적으로 활용하고자 한다. 공식 소개를 인용하면, 유니버스는 “AI(인공지능) 음성 합성, 모션 캡처, 캐릭터 스캔 등 IT(정보기술)와 엔터테인먼트 콘텐츠를 결합”한 서비스를 제공한다. 유니버스에서는 아티스트의 실제 목소리를 활용해 개발한 AI 보이스와 통화하거나, 행동이나 표정을 본뜬 모션 캡처와 보디 스캔으로 만든 아바타를 꾸밀 수 있다. 이러한 음성이나 아바타는 하쓰네 미쿠나 보컬로이드처럼 완전한 가상은 아니다. 그러나 팬과 실제 아이돌이 형성한 친밀감, 실제 아이돌의 특성이라는 현실이 인공지능과 결합한다는 점에서 넓은 의미의 가상 아이돌이다.
AI 아이돌에는 우려가 뒤따른다. 2020년 11월8일 경향신문 기사(심윤지 기자, “가상 아이돌은 인간을 대체할 수 있을까”…SM 걸그룹 ‘에스파’가 던진 질문)에서는 AI 아이돌을 둘러싼 다양한 윤리적 문제점을 지적했다. 에스파의 아바타가 여성의 신체를 관습적으로 물화하고 과도하게 성적 대상화하는 문법을 따랐다거나, 인공지능이 악용될 때 아티스트를 보호하거나 법적으로 처벌할 근거가 빈약하다는 점이 그것이다. ‘다시 한번’의 기술은 그리운 대상을 복원하지만, 원하는 대로 편집하고 왜곡할 수도 있다. 실제로 딥페이크 영상 중 96%가 포르노 영상이고, 피해자의 25%가 한국 여성 연예인이라고 한다. 그러나 이에 대한 기획사의 대처나 법적 규제는 전무한 수준이다. 실제 아이돌이 팀을 이탈하거나 계약이 종료되었을 때 아바타와 데이터에 대한 권리는 어떻게 되는지, 본인의 의지와 무관한 인공지능의 발언이나 퍼포먼스로 피해를 볼 때 어떻게 관리할지 등의 문제 또한 공백이다.
1990년대 후반~2000년대 초반을 강타한 천계영의 만화 <오디션>에는 네 명의 천재 소년으로 이루어진 재활용 밴드가 전설의 아이돌 ‘유니콘’과 경연하는 에피소드가 있다. 인기 절정일 때 돌연 은퇴를 선언하고 사라졌던 유니콘은, 외형과 음성을 그대로 간직한 사이버 가수로 돌아온다. 유니콘의 진실은 이렇다. 기획자는 처음부터 아이돌을 키우려는 목적으로 세 명의 아기를 입양하고, 아이돌의 신비한 이미지와 통일성을 위해 이마에 뿔을 이식하고 얼굴을 똑같이 성형한다. 그러나 심각한 수술 후유증으로 유니콘은 오래 활동하지 못하고 은퇴해야 했다. 인간의 부상과 불완전함을 경험한 유니콘의 기획자는 나이 들지도, 다치지도, 지치지도 않는 가상 아이돌을 시도한다. 천계영은 사이버 가수의 기획 의도를 정확히 꿰뚫어본 것이다.
유니콘 기획자의 욕망은 지금, 여기 가상 아이돌을 원하는 기획자의 목적과 정확히 일치한다. 아이돌로 경영은 하고 싶지만 인적 자원에 따르는 위험 부담을 짊어지기는 싫다. 꿈을 볼모로 착취와 폭력을 정당화하고, 아이돌의 열악한 노동환경이나 이들에게 강요되는 육체적·감정적 노동에는 무관심하다. 인간은 변수가 많고 복잡하고 어렵지만, 가상 아이돌은 철저한 통제가 가능하다. 보호와 개선보다는 가상 아이돌로 대체하는 게 더 쉽고, 효율적으로 보인다. 이렇게나 혁신적인, 이렇게나 4차 혁명적인, 이렇게나 미래 지향적인! 자신은 머리카락 한 올 내놓을 필요 없이 남의 데이터베이스로 시험하는, 잔뜩 신난 기획자들의 콧김이 느껴지는 것 같다. 본격적으로 가상 아이돌의 공을 쏘아 올린 SM이, 소속 가수를 잇달아 잃은 적 있으며 팬들이 기획사의 관리 소홀을 책망했던 사실은 의미심장하다.
<오디션>에서 사이버 가수 유니콘은, 유니콘의 노래를 편곡해 연주한 재활용 밴드에게 패배한다. 기획자는 유니콘을 불러놓고 “너희가 졌다”라고 말한다. 세 명의 유니콘은 답한다. “그건 우리들이 아니었어요. 처음부터 우리는 … 우리가 아니었어요.” 선택권이 없었던 유니콘의 대사는 지금 이 가상 아이돌과 인공지능 열풍에 경종을 울린다. 성큼성큼 앞서 나가는 기술과 시장을 선점하려는 부산함 앞에서, 주저앉은 채 통행을 방해하며 묻고 싶다. 가상을 쿠션 삼아 취약한 현실의 대상을 불확실성에 노출하는 것이 (안전장치도 없이) 옳은 일인가? 산 사람의 욕망은 행사할 수 없는 고인의 의사보다 우선시되는가? 우리에게 실제 대상이 말하지 않은 것, 행하지 않은 것을 듣고 볼 권리가 있는가? 늙거나 병들지 않는 불변의 속성이 더 우월하고, 언제 어디서든 연결되는 접근성이 ‘발전’인가?