DeepSeek V4与混元新模型将于4月发布，聚焦长期记忆与国产算力适配

推荐 2026-03-14 09:18

字号

SmartHey3月14日消息，据《白鲸实验室》爆料，DeepSeek V4 和由姚顺雨领衔研发的混元新模型，均预计将于2026年4月正式发布。

3月11日，AI模型分发平台OpenRouter上线两款神秘新模型——Healer Alpha 与 Hunter Alpha。平台页面显示，Healer Alpha 被定义为具备视觉、听觉、推理与行动能力的前沿全模态模型；社区迅速将其与待发布的国产新一代大模型关联，并指出其系统提示词中明确要求“严格遵守中国法律法规”，引发广泛关注。

据悉，DeepSeek V4 计划于4月上线。作为梁文锋团队历时多年打磨的多模态大模型，该版本不仅在代码生成能力上实现显著跃升，更在长期记忆机制方面取得关键突破。这一演进路径与其团队近半年来的技术布局高度吻合。

2026年1月，梁文锋作为通讯作者发表论文《Conditional Memory via Scalable Lookup》，首次提出可扩展的「条件记忆」架构；此前2025年12月发布的《mHC: Manifold-Constrained Hyper-Connections》则聚焦Transformer底层连接范式优化，持续攻坚长上下文建模、训练稳定性与记忆瓶颈问题。

过去半年，梁文锋团队重点补强DeepSeek在视觉理解与AI原生搜索两大短板。为加速AI搜索能力落地，DeepSeek已于2025年与百度达成深度技术协同。

长期记忆能力被确立为DeepSeek V4的核心迭代目标。此外，该模型将深度适配昇腾、寒武纪等国产AI芯片，有望成为首个全面运行于国产算力生态的大语言模型。