ETRI,방송뉴스 자막작업 가능한 인식시스템 개발

방송뉴스 음성을 실시간으로 자막처리하는 기술이 개발됐다. 이에따라 청각장애자 뿐만 아니라 일반시청자들도 방송 이해도를 높일수 있을 것으로 보인다. 한국전자통신연구원(ETRI) 음성언어팀장(팀장 박준)은 '청각 및 시각장애인을 위한 디지털방송 기술개발' 과제의 일환으로 방송뉴스 자막작업에 적용할 수 있는 연속음성 인식시스템을 개발했다고 27일 발표했다.

현재 우리나라 자막방송은 전체의 20%에서 40% 정도에 불과해 이의 확대가 요구되고 있다. 하지만 자막방송 작업이 한 채널당 4인 이상의 전문 속기타자 인력이 투입되어야 하기 때문에 어려움을 겪고 있다.

ETRI가 이번에 개발한 기술은 이같은 수동자막 작업방식에 음성인식 기술을 적용해 반자동화할 수 있도록 시스템화 했다. 즉, 방송뉴스 음성을 먼저 실시간으로 인식하고 결과를 전문 속기타자 요원이 수정하는 방식으로 자막작업을 하는 것이다.

이 시스템은 ETRI, KBS, SBS, 한국자막방송협회가 공동개발한 것으로 2개의 음성인식기를 통해 작업이 분담되게 설계해 음성인식 지연시간이 누적되지 않도록 했다. 또 뉴스 특성상 새로운 어휘가 항상 출현하므로 인터넷을 검색해 새로운 어휘를 검출해 이를 시스템에 반영하는 미등록어 검출 알고리즘 및 작업도구도 함께 개발했다.

음성언어팀 박준팀장은 "이 시스템은 방송뉴스가 다양한 음향환경으로 구성돼 있음에도 실시간 음성인식률이 음절기준으로 85%를 넘고 있다"며 "기술적용으로 인력부족 문제해소에 기여할 것"이라고 말했다. 042-860-6934

저작권자 © 헬로디디 무단전재 및 재배포 금지