SK스토아는 업계 최초로 AI 음성합성 기술을 선보이고 이를 점진적으로 확대해 나갈 계획이라고 밝혔다. 사진은 AI를 활용해 후시 녹음 편집을 진행하는 장면이다. (사진=SK스토아)
AI 기술이 TV홈쇼핑 오디오 분야에도 혁신적인 변화를 가져오고 있다. SK스토아(대표 양맹석)는 AI 음성합성 기술을 도입하고 이를 점진적으로 확대할 계획이라고 20일 밝혔다. AI 음성합성 기술은 쇼호스트 음성 수정이 필요한 경우 AI를 활용해 클로닝(특정 인물 목소리를 복제하는 최첨단 기술) 등 정교한 후반 작업을 진행, 자연스러운 음성을 구현하는 것을 의미한다. 기존에는 방송 촬영본에서 쇼호스트 멘트 수정이 필요할 경우 일정 부분을 다시 녹화하거나 쇼호스트가 직접 후시 녹음을 진행해야 했다.
수정 작업을 위한 인력, 비용 문제뿐만 아니라 기존 어조 그대로 재현해야하는 어려움이 있었다. 하지만, AI 음성합성 기술을 도입하면서, 재녹화 없이도 빠르고 자연스러운 멘트 수정이 가능해져 제작 효율성을 높일 수 있게 됐다. SK스토아는 해당 기술을 도입하기 위해 지난해부터 쇼호스트의 음성 테스트를 진행해왔다. 지난해 하반기부터는 네오사피엔스의 타입캐스트(typecast) 서비스를 활용하여 일부 패션 방송 프로그램의 가격 및 색상 멘트 수정, 프로모션 내용 변경 등에 AI 음성합성 기술을 적용, 성공적으로 도입했다.
올해는 쇼호스트 음색, 어조에 따른 다양한 클로닝 모델을 학습시키고 발음에 따른 정교한 타이밍 교정 등 기술을 고도화하여 AI 음성합성 기술 활용 분야를 점진적으로 확대할 계획이다. SK스토아는 상품 판매 방송에서 필수적인 성우 음성과 배경음악에도 AI를 활용하고 있다. 현재, 많은 정보를 빠르고 정확한 소리로 전달해야하는 보험 상품 약관 고지 등에 AI 성우 기술을 사용 중이다. AI 성우가 기존 성우나 쇼호스트 내레이션이 필요한 상품 설명 등을 완전히 대체하면서 기존 방식 대비 90% 이상 비용 절감 효과를 거두고 있다.
SK스토아는 홈쇼핑 방송 제작의 필수 요소인 배경음악 역시, AI음원 제작을 활용 중이다. 기존에는 배경 음악 제작을 위해 작사·작곡부터 녹음, 편집, 송출까지 긴 제작 과정이 필요해 많은 비용과 시간이 소요됐다. 하지만, AI를 통해 브랜드나 상품 특성을 반영한 음악을 보다 효율적으로 제작할 수 있게 됐다. 올해는 프롬프팅(AI와 상호작용하는 과정)을 정교화하기 위해 프롬프트 생성 자동화 시스템을 개발해 고품질 AI음원 제작을 가속화할 계획이다.
김형준 SK스토아 방송운영본부장은 “사내에서는 AI 복면가왕(AI 작사작곡 콘테스트) 등 다양한 프로그램을 마련해 AI에 대한 접점을 높이며 일하는 방식을 개선하고 있다. 이러한 노력이 사업적 혁신으로 이어지는 것 같다”며 “앞으로도 SK스토아가 독보적인 AI커머스 채널로 거듭날 수 있도록 끊임없이 노력하겠다”고 말했다.