Mistral, 오픈소스 음성 생성 모델 Voxtral TTS 출시 — 9개 언어 지원

Mistral이 오픈소스 텍스트→음성 변환 모델 Voxtral TTS를 출시했다. 영어, 프랑스어, 독일어, 스페인어, 네덜란드어, 포르투갈어, 이탈리아어, 힌디어, 아랍어 등 9개 언어를 지원한다. 음성 AI 어시스턴트, 기업 고객 지원, 접근성 도구 등에 활용할 수 있다.

Forge로 기업 맞춤형 AI 모델 구축 플랫폼을 출시한 직후 나온 발표다. Mistral은 LLM뿐 아니라 음성 생성까지 오픈소스 생태계를 넓히면서, OpenAI와 앤스로픽의 폐쇄형 모델에 대항하는 유럽 기반 오픈소스 진영의 핵심 플레이어로 자리잡고 있다. ElevenLabs가 SXSW에서 100만 명 목소리 캠페인을 진행한 음성 AI 시장에 오픈소스 대안이 등장한 셈이다.

오픈소스 TTS의 장점은 기업이 자체 인프라에서 운영할 수 있어 음성 데이터를 외부로 보낼 필요가 없다는 것이다. 의료, 금융, 법률 등 민감한 데이터를 다루는 엔터프라이즈 고객에게 매력적인 옵션이다.

FAQ

Voxtral TTS란?

텍스트를 자연스러운 음성으로 변환하는(Text-to-Speech) AI 모델이다. 오픈소스로 공개돼 누구나 사용하고 수정할 수 있다.

ElevenLabs와 뭐가 다른가?

ElevenLabs는 상용 서비스로 음성 클로닝에 강점이 있다. Voxtral TTS는 오픈소스라 기업이 자체 인프라에서 운영할 수 있고, 데이터를 외부로 보낼 필요가 없다는 차이가 있다.

왜 9개 언어인가?

Mistral의 유럽 기반 전략을 반영한다. 영어 외에 프랑스어, 독일어 등 유럽 주요 언어와 힌디어, 아랍어까지 포함해 글로벌 엔터프라이즈 시장을 타깃으로 한다.

Mistral, 오픈소스 음성 생성 모델 Voxtral TTS 출시 — 9개 언어 지원

FAQ

댓글