MiniMax Audio推出Speech-02系列语音模型,引领语音合成新高度

2025年4月,音频技术创新者MiniMax Audio正式发布了其全新的Speech-02系列语音模型,这一新版本在语音合成领域取得了重大突破,为用户带来更真实、更流畅、更便捷的音频体验。

一、技术突破:高自然度与长文本处理

Speech-02系列语音模型支持超过30种语言,一次性可输入长达20万字符的文本。这一功能极大地提升了处理大规模文本的能力,例如创建音频书籍、播客等长音频内容变得更加便捷。此外,Speech-02的人声相似度高达99%,合成的语音自然流畅,有效解决了音频播放中的卡顿和节奏不稳问题。
Minimax Audio推出speech 02系列语音模型,引领语音合成新高度

二、功能创新:个性化与便捷性

MiniMax Audio为Speech-02系列新增了“Read Anything”功能,用户可以上传本地文件或粘贴网络URL,将文档、电子书、网页文章等多种内容转化为喜欢的音色聆听。此外,该模型还支持情感设置选项,包括高兴、生气、伤心等8种情绪,用户可以根据需求调整声音的深度和强度。这些功能不仅方便了个人用户的阅读需求,还广泛适用于教育、出版和企业培训等多个领域。
Minimax Audio推出speech 02系列语音模型,引领语音合成新高度

三、应用场景:多元化与广泛性

Speech-02系列语音模型的高自然度和强大的文本处理能力使其在多个实际应用场景中表现出色。它不仅适用于有声书和播客制作,还为跨境电商、AI出海、角色扮演等场景提供了强大的技术支持。例如,用户可以通过10秒录音实现1:1克隆声音,每日免费赠送4000积分(约5分钟音频),极大地降低了使用成本。
Minimax Audio推出speech 02系列语音模型,引领语音合成新高度

四、市场反响:技术领先与用户体验

Speech-02系列语音模型的推出得到了市场的高度关注和好评。其高达99%的人声相似度和零节奏故障的性能,使其在语音合成领域处于领先地位。尽管性能大幅提升,但Speech-02依然保持了亲民的价格,让更多用户能够受益。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐