近日,DeepSeek团队在未召开发布会的情况下,悄然上线了全新的V3.1版本模型。这一版本在多个方面实现了显著的性能提升和创新,迅速引发了技术圈和投资圈的广泛关注。
一、性能显著提升,超越行业标杆
DeepSeek V3.1在编程能力方面表现尤为突出,在Aider编程基准测试中取得了71.6%的高分,超越了此前公认的编程强者Claude 4 Opus。此外,该版本在长文本处理、百科知识、数学推理等多个领域也表现出色,其性能与世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不相上下。

二、架构创新与成本优势
DeepSeek V3.1新增了原生「search token」的支持,这意味着模型在搜索功能上得到了更好的支持。同时,线上模型去除了「R1」标识,引发了行业对DeepSeek未来可能采用「混合架构」的广泛猜测。在成本方面,V3.1完成一次完整的编程任务仅需1.01美元,成本仅为专有系统的六十分之一。
三、开源与社区支持
DeepSeek V3.1拥有685B参数,支持多种精度格式,从BF16到FP8。该版本继续秉承开源精神,开源了原生FP8权重,为开发者提供了更多的灵活性和创新空间。得益于开源社区的支持,SGLang和LMDeploy第一时间支持了V3.1模型的原生FP8推理。

四、应用场景拓展
DeepSeek V3.1的上下文长度拓展到128k,这使得其在处理长文本和复杂任务时更具优势。其在教育、金融、编程等多个领域的应用前景广阔,能够为用户提供更加高效、低成本的解决方案。


