Seamless Communication - Meta AI
SeamlessM4T achieves state-of-the-art in quality for speech translation on multiple lengths of audio and text — a step change when compared to other leading direct systems. The model leverages Fairseq2, our newest modeling toolkit which was redesigned fr
ai.meta.com
핵심 포인트:
Meta AI가 SeamlessM4T라는 Multimodal, Multilingual AI 번역 및 텍스트 변환 모델을 소개함. 이 모델은 음성 및 텍스트 번역과 변환의 중요한 돌파구며, 이전 시스템의 한계를 극복한다고 소개하며, 특히, 이 모델은 음성 및 텍스트 입력에 대해 거의 100개의 언어를 지원하며, 텍스트 출력에 대해 100개의 언어 (한국어 포함), 음성 출력에 대해 35개의 언어(얘도 한국어 포함) 를 지원합니다. 다양한 언어와 모드에서의 번역 및 변환 작업을 단일 시스템에서 처리할 수 있게 되었다.
시사점:
SeamlessM4T의 도입은 음성 및 텍스트 번역 분야에서의 혁신적인 발전임. Whipser V2보다도 훨씬 뛰어난 성능을 가지고 있는데 아주 보기 좋은 경쟁이 아닐까 싶음. 이러한 기술적 발전은 다양한 언어 및 문화 배경을 가진 사람들 간의 원활한 의사소통을 촉진할 것이라 의심치 않음. 언어를 배워야 한다는 것 자체에 근본적으로 새로운 의문을 가질 수 밖에 없게 만드는 것 같다. 아마 Meta Quest 3 같은거에 연동되어서 나온다면? 그럼 좀 대박일 것 같긴 하다.
'CS & AI study > IT News' 카테고리의 다른 글
[2023/08/25] 메타 출신의 바이오텍 스타트업, 최소 4천만 달러의 투자 확보 (0) | 2023.09.05 |
---|---|
[2023/08/29] Meta, Computer Vision를 위한 FACET 벤치마크 공개 (0) | 2023.09.04 |
[2023/08/22] Python in Excel: Python + Excel 이 불러올 데이터 분석 기능의 향상 (0) | 2023.08.27 |
[2023/08/19] Meta, AI 기반 코드 생성 봇을 출시 예정 (0) | 2023.08.22 |
[2023/08/16] Google Chrome, 생성 AI를 통해 전체 기사를 요약하는 기능 발표 (0) | 2023.08.17 |