MiniMax Music 1.0于2025年2月亮相时,只能生成30秒片段;短短七个月后,MiniMax Music 1.5把上限拉到4分钟,且支持16种风格、11种情绪、10个场景的任意组合。业内人士指出,这一跨度相当于把“AI小样”直接升级为“可用成曲”,标志着国内自研音乐大模型首次在长时序、多段落、人声与编曲一体化方面追上国际一线水平。
1 从30秒到4分钟:技术突围 “最大难点是记忆。”MiniMax音频团队负责人透露,1.5版采用线性注意力+MoE(混合专家)架构,把传统O(n²)复杂度降为O(n),使GPU在4分钟长度下仍能维持44.1 kHz立体声采样率;同时引入“分段歌词注入”机制,让主歌-副歌-桥段结构自动对齐,解决了AI音乐“虎头蛇尾”的通病。

2 实测:输入一句“夏夜海边,微醺R&B”,3分52秒作品一次成型 记者在海螺音乐官网试用,仅输入中文提示词并选择“R&B”“浪漫”“海边”标签,系统2分18秒返回一段3分52秒的完整歌曲:前奏海浪采样、808鼓、电钢Riff、男声主旋律、和声层叠,副歌自动加入女声应答。整曲结构清晰,无断档或节拍漂移,可直接用于短视频BGM。
3 行业冲击:配乐外包报价或降三成 “过去4分钟定制歌,市场价3000-10000元,还要排期一周。”广州某MCN音乐总监算了一笔账:MiniMax Music 1.5 API调用成本约0.8元/分钟,且版权归属用户,意味着一条4分钟成曲成本不到5元。若批量生产,人力费用可压缩70%,预计年内中小短视频团队的配乐外包预算将下降30%。

4 版权与伦理:平台急补“AI标签” 音著协在9月13日发文,要求平台对AI生成音乐添加“AI”水印,并保留提示词与模型版本备查。腾讯音乐、抖音均已上线“AI作品声明”选项,若未标注被权利人投诉,流量收益将回退给版权方。MiniMax回应,已在文件元数据写入不可篡改的“M1.5”签名,并开放溯源接口,帮助平台合规分发。
5 未来路线:8分钟与多轨分轨在望 MiniMax透露,1.5只是“中期版本”,年底将测试8分钟生成与分轨导出(人声、鼓、贝斯、和声独立WAV),方便混音师二次加工。同时,公司正与香港某唱片公司试点“AI辅助唱片”,让人气偶像提供声纹,粉丝即可在线生成与偶像合唱的4分钟单曲,开辟ToC付费新场景。


