DeepSeek V4与混元新模型将于4月发布,聚焦长期记忆与国产算力适配
SmartHey3月14日消息,据《白鲸实验室》爆料,DeepSeek V4 和由姚顺雨领衔研发的混元新模型,均预计将于2026年4月正式发布。
3月11日,AI模型分发平台OpenRouter上线两款神秘新模型——Healer Alpha 与 Hunter Alpha。平台页面显示,Healer Alpha 被定义为具备视觉、听觉、推理与行动能力的前沿全模态模型;社区迅速将其与待发布的国产新一代大模型关联,并指出其系统提示词中明确要求“严格遵守中国法律法规”,引发广泛关注。
据悉,DeepSeek V4 计划于4月上线。作为梁文锋团队历时多年打磨的多模态大模型,该版本不仅在代码生成能力上实现显著跃升,更在长期记忆机制方面取得关键突破。这一演进路径与其团队近半年来的技术布局高度吻合。
2026年1月,梁文锋作为通讯作者发表论文《Conditional Memory via Scalable Lookup》,首次提出可扩展的「条件记忆」架构;此前2025年12月发布的《mHC: Manifold-Constrained Hyper-Connections》则聚焦Transformer底层连接范式优化,持续攻坚长上下文建模、训练稳定性与记忆瓶颈问题。
过去半年,梁文锋团队重点补强DeepSeek在视觉理解与AI原生搜索两大短板。为加速AI搜索能力落地,DeepSeek已于2025年与百度达成深度技术协同。
长期记忆能力被确立为DeepSeek V4的核心迭代目标。此外,该模型将深度适配昇腾、寒武纪等国产AI芯片,有望成为首个全面运行于国产算力生态的大语言模型。
