언론기사

OTT 자막 생성 효과적으로 빠르게...정부 지원 R&D 한창

2022-10-11

국산 온라인동영상서비스(OTT) 내 한글 자막 서비스 확대를 위한 연구개발(R&D)이 한창이다. 정부와 연구 전문관리기관 주관으로 미디어 취약계층 OTT 접근성 확보 관련 R&D가 본궤도에 올랐다.

과학기술정보통신부와 정보통신기획평가원(IITP·원장 전성배)은 지난 4월 '구어체 방송 콘텐츠 자막 제작·편집 기술 개발' R&D 사업에 착수했다.

콘텐츠 음성을 AI가 인식, 자막·싱크 자동 번역 및 생성이 골자다. OTT 분야 '배리어프리'를 위한 것이다. 배리어프리는 이름처럼 '장벽'을 허물어 고령자·장애인 서비스 접근성을 높이는 것이다. 넷플릭스는 대사는 물론, 음향 정보나 화자까지 자막화하는 '폐쇄형 자막'을 모든 콘텐츠에 담아 서비스한다.

전부터 국산 OTT 서비스에서도 이런 서비스가 확대·적용돼야 한다는 의견이 나왔고 정부와 IITP가 발맞춰 과제를 준비했다.

콘텐츠 자막 제작·편집 기술 R&D에 참여한 김유석 시스트란 대표(사진 왼쪽)와 백선호 트위그팜 대표가 개발 방향을 상의하고 있다.
<콘텐츠 자막 제작·편집 기술 R&D에 참여한 김유석 시스트란 대표(사진 왼쪽)와 백선호 트위그팜 대표가 개발 방향을 상의하고 있다.>

트위그팜 주관으로 시스트란과 SBS, 푸르모디티, 콘텐츠웨이브가 힘을 모아 다양한 특장점을 더할 방침이다.

먼저 시스트란 기술로 영상 장르와 전후 문맥을 따져 자막 생성 정확도를 높인다. 액션이나 멜로 등 장르별 주로 쓰이는 단어가 다른 점에 착안, 기본 엔진 외에 추가 학습을 진행해 자막 번역·생성 정확도를 극대화한다. 또 단일 문장만이 아닌 앞·뒤 문장을 고려해 정확도를 더욱 높인다.

트위그팜은 특히 플랫폼 개발 분야에 활약한다. 클라우드를 기반으로 방송사, OTT 사업자, 자막 기업 등을 한 플랫폼에 모으고 단계별로 적합한 AI 모델과 인력이 배치돼 협업하도록 한다. 자막 제작, 결과 검수 등 인력 기반에서, 많은 시간·비용이 드는 작업을 상당 부분 자동화해 절감 효과가 클 전망이다. 이용자와 사업자 모두에 윈윈 효과를 낸다.

이들 기술로 생성하는 자막은 우리말에 국한되지 않는다. 김유석 시스트란 대표는 “영어와 중국어, 일본어, 이후 유럽·동남아 언어까지 영역을 확장할 계획”이라며 국내 OTT 글로벌 진출에도 기여할 수 있다고 전했다.

실효성을 담보한다는 것이 특히 이목을 끈다. 백선호 트위그팜 대표는 “이번 사업은 정부·IITP 노력으로 방송사, OTT 사업자 등 수요처까지 연계해 자연스러운 실증이 이뤄진다”며 “내년 중 웨이브 시범서비스를 개시해 이용자의 OTT 이용 편의를 도모하겠다”고 밝혔다.

ETRI가 개발한 기술은 한국어 문장을 수어로, 이를 다시 아바타 애니메이션으로 변환한다.
<ETRI가 개발한 기술은 한국어 문장을 수어로, 이를 다시 아바타 애니메이션으로 변환한다.>

정부 지원으로 이미 이룬 미디어 취약계층 대상 기술도 있다. 한국전자통신연구원(ETRI) 안충현 박사팀이 한국어 문장을 수어로 번역해, 아바타로 표현하는 '시청각 장애인 방송시청을 지원하는 감성 표현 서비스' 기술을 구현했다. 이한규 ETRI 책임연구원은 “기술 기업 이전을 통해 기술 실용화가 이뤄지도록 노력 중”이라며 “데이터셋 확보, 모델 고도화가 이뤄진다면 OTT 적용도 가능하다”고 말했다.

←  뉴스 리스트로 가기