智谱GLM-5架构意外曝光:复用DeepSeek技术路线市值狂飙200%,国产AI迎"春节档"激战

2026年春节期间,国产大模型赛道再掀波澜。智谱AI下一代旗舰模型GLM-5的技术架构通过GitHub开源社区意外泄露,引发资本市场强烈反响。港股智谱AI股价两日暴涨60%,较IPO发行价累计涨幅近200%,总市值突破1500亿港币。这款被开发者从代码提交中"挖掘"出的745B参数大模型,不仅采用与DeepSeek-V3同款的稀疏注意力架构,更以神秘身份"Pony Alpha"提前亮相OpenRouter平台,展现出逼近Claude Opus的代码生成能力。

一、技术架构曝光:复用DeepSeek路线实现性能跃升

GLM-5的核心技术细节并非来自官方发布,而是被开发者在vLLM推理框架的GitHub PR中发现。代码显示,该模型全面采用DeepSeek-V3/V3.2架构,包括DeepSeek稀疏注意力机制(DSA)和多Token预测(MTP)两大核心技术。
DSA机制通过Lightning Indexer组件快速扫描历史token并评估相关性,仅对Top-k个高相关token进行完整注意力计算,在大幅提升长文本处理效率的同时几乎不影响输出质量。架构参数显示,GLM-5总参数量达745B,是前代GLM-4.7的两倍;采用MoE架构,拥有256个专家但每次仅激活8个(约44B激活参数),稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。上下文窗口最高支持202K token,显著增强复杂场景应用能力。智谱glm 5架构意外曝光:复用deepseek技术路线市值狂飙200%,国产ai迎"春节档"激战

二、身份谜团揭晓:匿名模型"Pony Alpha"实为GLM-5测试版

2月初,全球模型服务平台OpenRouter突然出现代号为"Pony Alpha"的匿名模型,其编程与推理能力极为强劲,迅速引发开发者社区热议。技术社区通过多维度逆向测试确认其身份:系统提示词测试中模型自曝"I'm GLM";特定字符串的PoC令牌测试显示其与GLM-4分词器反应完全一致;甚至GLM家族特有的逻辑Bug(如输入"锅内倒入植物油烧热"得到异常答案)也高度吻合。
该模型支持200K上下文窗口,能根据单条提示直接生成功能完整的应用程序,在复杂推理和Agent工作流上表现突出。智谱首席科学家唐杰此前在内部信中预告的发布窗口,与"Pony Alpha"出现时间节点完全吻合,进一步佐证了市场判断。智谱glm 5架构意外曝光:复用deepseek技术路线市值狂飙200%,国产ai迎"春节档"激战

三、市场影响深远:部署门槛降低与多模态补齐

复用DeepSeek架构为GLM-5带来显著生态优势。由于技术路线一致,该模型可直接受益于vLLM、SGLang等主流推理框架的现有优化,大幅降低企业级用户的部署门槛和算力成本。值得关注的是,针对DeepSeek纯文本架构的短板,GLM-5特别强化了视频理解等多模态能力,以适配2026年市场对全模态大模型的需求。
此次架构泄露恰逢国产AI"春节档"激战,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等同期发布更新,市场竞争白热化。智谱AI股价两日暴涨60%的表现,反映出资本市场对国产大模型技术路线收敛、工程化落地能力增强的高度认可。分析人士指出,架构复用趋势将加速国产AI生态整合,但GLM-5最终能否在多模态能力与商业落地上兑现预期,仍需官方正式发布后验证。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手