클로바 스피치에 적용
'자막을 입력하는 데 더 이상 문제가 없습니다.'
네이버클라우드가 인공지능(AI) 기반으로 음성을 텍스트로 변환해 실시간 방송에서 화자의 음성을 추출해 즉시 자막을 생성하는 기업용 '클로바 스피치'에 '실시간 스트리밍' 기능을 출시했다. 그 날이 공개되었습니다.
네이버클라우드에 따르면 클로바스피치는 높은 수준의 한국어 인식률과 빠른 인식 속도를 갖춘 음성-텍스트(STT) 서비스로, 네이버 클라우드 플랫폼에서 운영되는 기업용 제품이다.
현재 본 서비스는 네이버 뉴스의 자막 자동 생성 기능, 네이버 쇼핑 라이브, 고객센터 통화 데이터 관리 등에 적용되어 있습니다.
이번에 새롭게 선보인 실시간 스트리밍은 라이브 방송 등 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출하는 기술이다. 한국어, 영어, 일본어 3개 언어를 지원하며, 음성의 각 단어별로 텍스트가 구성됩니다.
이에 대해 회사 측은 “현재 생방송 실시간 자막 서비스는 속기사가 개별적으로 작성한 자막을 제공하지만, 실시간 스트리밍 기술을 활용하면 별도의 타이핑 없이 실시간으로 자막을 전송할 수 있다”고 설명했다.
이어 “고객센터에서도 통화 내용을 즉시 문자로 변환해 모니터링할 수 있어 더욱 빠른 고객 응대가 가능하다”고 강조했다.
한편, 네이버 클라우드는 실시간 스트리밍 신규 출시에 맞춰 다양한 사용자 요구에 맞춘 옵션을 제공하고, 더 많은 고객이 이용할 수 있도록 서비스 요금을 인하했다고 밝혔다.
음성인식, 화자 인식 비용의 경우 기존 비용 대비 40% 비용을 절감했으며, 단일 요금제에서 제공되던 기능을 음성인식, 화자 인식, 이벤트 감지로 세분화했다. 박수, 음악, 외침 등 인식) 및 각 기능에 대한 요금이 인상되었습니다. 이를 세분화해 고객이 필요한 기능에 맞춰 선택할 수 있다는 게 회사측 설명이다.
또한, 영어 발음의 정확성을 판단하는 기능이 옵션 옵션으로 추가되었습니다.
김성훈 네이버 클라우드 AI 상품기획팀장은 “방송사, 라이브커머스 기업, 유튜버 등 실시간 방송이 필요한 산업에서 실시간 스트리밍 기능의 활용도가 높아질 것으로 기대한다”고 말했다. 이어 “앞으로도 AI 기반 클로바 서비스를 지속적으로 고도화해 나갈 예정이다. 이어 “귀사의 사업 성장에 도움이 되도록 지원하겠다”고 말했다.