다양한 방언을 이해할 수 있는 AI를 위해 메타는 텍스트와 음성 전반에 걸쳐 100개에 가까운 언어를 번역하고 받아적을 수 있는 AI 모델 심리스(Seamless)M4T를 개발했다고 테크크런치가 22일 보도했다.
테크크런치의 보도에 따르면 메타는 새로운 번역 데이터 세트인 심리스얼라인(SeamlessAlign)과 함께 오픈 소스로 제공되는 심리스M4T가 AI 기반 음성 음성 변환 및 음성 텍스트 변환 분야에서 "중요한 혁신"을 이루었다고 주장했다.
메타는 블로그 게시물에서 “우리의 단일 모델은 다른 언어를 사용하는 사람들이 보다 효과적으로 의사소통할 수 있도록 하는 주문형 번역을 제공한다.”라며 "심리스M4T는 별도의 언어 식별 모델 없이도 소스 언어를 암시적으로 인식한다."라고 설명했다.
심리스M4T는 음성-음성 번역 시스템 중 하나인 유니버설 스피치 트랜스레이터(Universal Speech Translator)의 후속 제품이다.
또 1,100개 이상의 언어에 걸쳐 음성 인식, 언어 식별 및 음성 합성 기술을 제공하는 메타의 프레임워크인 매시블리 멀티링구얼 스피치(Massively Multilingual Speech)를 기반으로 한다.

댓글 (0)
댓글 작성