Mistral이 오픈소스 텍스트→음성 변환 모델 Voxtral TTS를 출시했다. 영어, 프랑스어, 독일어, 스페인어, 네덜란드어, 포르투갈어, 이탈리아어, 힌디어, 아랍어 등 9개 언어를 지원한다. 음성 AI 어시스턴트, 기업 고객 지원, 접근성 도구 등에 활용할 수 있다.
Forge로 기업 맞춤형 AI 모델 구축 플랫폼을 출시한 직후 나온 발표다. Mistral은 LLM뿐 아니라 음성 생성까지 오픈소스 생태계를 넓히면서, OpenAI와 앤스로픽의 폐쇄형 모델에 대항하는 유럽 기반 오픈소스 진영의 핵심 플레이어로 자리잡고 있다. ElevenLabs가 SXSW에서 100만 명 목소리 캠페인을 진행한 음성 AI 시장에 오픈소스 대안이 등장한 셈이다.
오픈소스 TTS의 장점은 기업이 자체 인프라에서 운영할 수 있어 음성 데이터를 외부로 보낼 필요가 없다는 것이다. 의료, 금융, 법률 등 민감한 데이터를 다루는 엔터프라이즈 고객에게 매력적인 옵션이다.