当DeepSeek V4以1.6万亿参数刷新开源模型纪录之际,国产大模型的参数军备竞赛再度升温。据多家科技媒体4月28日报道,月之暗面下一代旗舰大模型Kimi K3参数规模将达到2.5万亿,大幅超越DeepSeek V4 Pro的1.6万亿,刷新国产大模型参数纪录,预计于今年第三季度正式发布。

一、2.5万亿参数:国产大模型新纪录
Kimi K3参数量达到2.5万亿,不仅比当前Kimi K2.X系列的万亿参数翻倍还多,也大幅超越了百度文心5.0的2.4万亿参数,成为国产参数量最大的大模型。参数规模的跃升,意味着模型拥有更强的表达能力和知识容量,能够处理更复杂的推理任务。
除参数量大幅提升外,Kimi K3的上下文长度也将达到1M(100万字),相比Kimi K2.6的256K上下文提升近4倍。爆料信息还指出,内部测试实际上远超1M,在超长文档处理、长程任务执行等场景中展现出惊人能力。
参照Kimi K2.6已展现的"13小时编码+5天自主运行"长程战力,Kimi K3有望在Agent自主执行、工程级成果交付等维度实现质的突破,进一步缩小与全球顶尖闭源模型的差距。
二、密集迭代背后的国产大模型竞速
Kimi K3的曝光,是国产大模型近期密集迭代的缩影。仅在过去一周,DeepSeek-V4(1.6万亿参数/百万上下文)、智谷GLM-5.1、腾讯混元Hy3、小米MiMo-V2.5、阿里Qwen3.6等模型相继发布或开源,国产AI正在经历一场"百模大战"式的快速迭代。
值得关注的是,这一轮迭代的核心方向高度聚焦于两个方向:一是Agent自主执行能力,各厂商纷纷强调模型在复杂任务中独立、持续工作的能力;二是百万级长上下文,将处理长文档、长代码库、长程对话的能力作为标配。
与闭源模型相比,国产开源大模型的性价比优势依然显著。以DeepSeek-V4为例,其API定价仅为国外对标模型的数十分之一,推动了AI能力在更广泛场景中的普惠落地。
三、从K2到K3:月之暗面的技术演进路径
月之暗面自2024年推出Kimi智能助手以来,保持着高频迭代节奏。Kimi K1主打长上下文和对话能力,K2引入MoE架构和Agent集群,K2.6则在代码生成和长程任务执行上取得突破,被官方称为"迄今为止最强的代码模型"。
Kimi K3预计将在以下方向实现升级:更强的多模态理解能力,融合视觉、语音、文本的全模态感知;更高效的稀疏激活,在2.5万亿参数规模下保持合理的推理成本;以及更强大的长程Agent能力,支撑端到端的复杂工程任务交付。
随着参数量突破2.5万亿,Kimi K3也将面临推理成本和部署难度的双重挑战。如何在高参数规模下保持推理效率、降低成本,将是月之暗面在Q3发布前需要解决的关键问题。


