智谱上市，CSO唐杰发全员信要求全面回归基础模型研究

推荐 2026-01-08 14:14

字号

SmartHey1月8日消息，今天上午，“全球大模型第一股”智谱在港交所主板挂牌上市，发行价为每股 116.20 港元（现汇率约合 104.5 元人民币），开盘报 120 港元 / 股，市值突破 528 亿港元。

据“晚点LatePost”获取的清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰内部信，智谱很快将推出新一代模型 GLM-5。

唐杰在信中提到，今天是“智谱生命中激动人心的一天”。智谱 2025 年如期完成了年初定下的战略，即 4 月发布一个“稳住阵脚”的模型、年中发布一个“上牌桌”的模型（成为 one of the best）、年底发布一个 Top 1 的模型。

内部信还介绍了智谱今年将聚焦的三个技术方向：全新的模型架构设计，更通用的 RL（强化学习）范式，以及对模型持续学习与自主进化的探索，这三个方向均围绕基础模型能力提升展开。

唐杰透露，智谱内部设立了一个全新部门 X-Lab，将致力于以开放方式聚集更多年轻人开展前沿性探索，包括研发全新模型架构、探索新的认知范式，并孵化新项目，不局限于软件或硬件领域。

“同时，我们也会扩大对外投资，不仅仅是战略联合已有的被投企业，也要开辟新的版图，让整个行业贯通起来，让整个生态一起繁荣。在 X-Lab，每个人的使命就是做完全颠覆式的创新，最终回归到 AGI 的主线。”

以下是唐杰内部信全文：

用“咖啡”的精神做 AGI

在香港科技大学做短期访问时，和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝得太多，感觉有点上瘾，需要戒一戒了。

杨老师说：“为什么要戒呢？上瘾也不一定是坏事呀，如果我们做研究能像喝咖啡一样上瘾，又何愁研究做不好呢？”

是啊，“上瘾”便是人生的精彩所在，无论是研究，还是其他事情，只要专注、努力，就一定能做好。

“让机器像人一样思考”是智谱自始至终的愿景和理想，也是智谱人持之以恒奋斗的唯一目标。

2018年底，在人脑认知的双系统理论启发下，我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱，开始尝试探索AGI，实现“让机器像人一样思考”的宏伟愿景。

这里的最大挑战可能是直到今天也没有人——包括我们自己——能够给出一个准确的AGI定义以及如何实现AGI的技术路径，也许这正是探索AGI的魅力所在。

我们正处在一个历史上前所未有的非凡时刻，一个技术再次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座，更有望成为驱动生产力变革的核心引擎。

回顾一路走来的历程，我们能走到今天的一个重要原因，是我们始终坚持做让用户真正用得上的AI技术。只有真正有人使用的理论、技术或产品，才能最终成为AGI之路上的重要成就。当然，并非所有创新都能成功，我们也曾有不少高风险项目以失败告终，但这些经历往往教会我们从失败中汲取力量，这让智谱变得更强大，对AGI的理解也更加深刻。

更重要的是，这让我们在注重实用性的同时，不再只盯着短期收益：帮助用户、助力国家发展、推动全球科技进步，已成为智谱的长期目标。

2020年，我们推出了自研的大模型算法架构GLM，并开始训练100亿参数的基座模型。该模型取得了成功，获得了包括美团在内的多家企业试用。这是一个大胆的尝试，因为在当时仍是BERT主导的小模型时代。尽管如此，当时的成果距离我们梦想中的AGI仍遥不可及，部分原因是模型知识量不足，另一部分则是模型尚不具备类人的推理能力。

2021到2022年，大模型的发展并不顺利，大多数人并不接受“让机器像人一样思考”这种类似登月计划的宏大构想，也不认为这是重大技术变革的机会，或者因害怕失败而却步。但我们仍决定冒险一搏，使用更多数据训练一个1300亿参数的大模型。

这一决策极具挑战性，因为它不能影响公司整体发展节奏。为此，我们成立了两个独立的小型创新团队：一个专注于模型训练，即后来被称为GLM三剑客的团队；另一个则独立负责MaaS平台建设。当时这两个小团队甚至彼此不知对方的存在。

2022年中，GLM-130B成功训练完成，其中多项精细设计引起全球关注；与此同时，MaaS平台上线（即现在的bigmodel.cn），迎来了第一批真正的API用户。随后，我们正式成立AI研究院，专注下一代大模型研发；并设立MaaS平台部，负责对外提供大模型API服务。有时候，我们需要找到足够有梦想的人（甚至专门投入精力去寻找），一个宏大目标或许已经决定了半数的成功。

2023年，我与国内一位顶尖创业前辈（其实他比我年轻不少）探讨AI对未来的影响，我们一致认为AI将颠覆搜索、颠覆浏览器，为每个人带来全新的AI助手；甚至在拥有AI助手之后，我们可能不再需要传统应用商店，反而需要为AI打造一个“API商店”，其底层逻辑或将重塑现有操作系统；更深远的颠覆可能是计算机本身——届时我们或许不再需要为人设计的计算机，而是专为AI优化的新架构。

这一变革的意义将是深远的，因为它将彻底重塑计算机的底层逻辑，挑战计算机界沿用80年的奠基石——冯诺伊曼体系。聊到这里时，我们都不约而同地感到，我们对AI的投入还远远不够，尚未真正做到All-in。

现实是残酷的，All-in不仅需要坚定的信念，还需要强大的资金与团队支持，以及精准的未来预判。2023至2024年是全球大模型爆发之年，各大厂商纷纷“All-in”大模型，国内也掀起创业热潮，百模大战、各类AI助手层出不穷。

那段时间我们或许也有失误，无论是在技术还是商业层面。现在复盘来看，可能的原因是在追逐AGI的路上有所迷失，被眼前的短期收益和热闹氛围所迷惑。AGI是一场技术变革，技术应是平权的、公开透明的，要让所有人都能使用并从中受益。

随后DeepSeek的出现警醒了我们。文锋在2023年创业前曾与我交流，当时我并未意识到他对AGI如此执着，感谢他带给我许多全新的思考。选择对AGI技术的执着追求，不断探索其能力边界，同时做出精准的未来判断，是下一步智谱需要持续改进和升华的方向。这两年让我们经历了诸多考验，更重要的是通过“强化学习”深化了我们对AGI、公司治理和商业竞争的认知。

过去一年，我们进行了一次系统的“强化”。我们提出“定力”与“成就”的口号，要求全员保持定力，不骄不躁，不妄自菲薄，专注于把手头的事情做到极致，成就自我。

年初时，一切都很艰难：模型效果未达预期，全国范围内价格战激烈，突围亟需精准突破口。

我们坚守阵地，最终选定Coding作为突破口。

如果说4月GLM-4.1的发布只是象征性的试探，那么7月底发布的GLM-4.5几乎是一场决战。所有技术、平台和业务团队都高度紧张，日夜奋战，终于迎来久违的胜利。随后GLM-4.6和GLM-4.7使我们的模型能力与国际顶尖水平并驾齐驱。

我们的GLM-4.7在AA、竞技场等多项评测中取得开源模型、国产模型的SOTA成绩，用户反馈在Coding和Agent方面的实际体验也非常出色。全球184个国家的15万名开发者使用GLM Coding Plan，GLM-4.7发布后，MaaS平台ARR年化收入突破5亿元（其中海外收入超2亿元），从2000万元增长至5亿元（25倍）仅用10个月。

总体而言，在模型侧我们如期完成了年初制定的战略目标：4月发布“稳住阵脚”的模型、年中发布“上牌桌”的模型（one of the best）、年底发布Top 1模型。这为我们后续冲刺AGI技术高地奠定了坚实基础。

我们的「主权AI」也取得新进展：马来西亚国家级MaaS平台基于Z.ai开源模型构建，GLM已成为该国的国民级模型。“主权AI出海”是我参加总书记座谈会后受“中国AI要走出国门”讲话感召而推动的方向，说实话起初并不知如何着手，但我们的国际团队敢拼敢打，完成了中国大模型从无到有出海的里程碑。业务方面，我们敢于竞争，再次实现年度营收同比增长超一倍的目标。

在重重困难与机遇并存的背景下，今天，我们以一种几乎不可能的姿态成为“全球大模型第一股”，这标志着市场对我们技术价值与商业模式的高度认可。“Make impossible possible”——还记得我们曾经说过的话吗？

这一年来，蜕变最大的或许不是智谱本身，而是一群奋战在一线的年轻人，他们把许多看似不可能的事，真正变成了现实。

2026年，公司的目标是成为国际领先的大模型企业。过去一年，关于大模型的讨论多集中于应用场景与生态系统。

真正决定下一阶段格局的，仍是两个更底层的问题——模型架构与学习范式。同时，应用层面可能出现清晰趋势：2026年或将成为AI替代各类工种与任务的爆发之年。

基于这一判断，我们在2026年将聚焦以下方向：

GLM-5：新一代模型GLM-5即将面世，通过进一步Scaling和多项技术创新，相信它将带来全新体验，帮助AI完成更多真实任务。

全新模型架构设计：已广泛应用近十年的Transformer架构已显现出局限，如超长上下文计算开销大、记忆机制薄弱、更新机制效率低等。我们需要探索全新架构，发现新的Scaling规律，并通过芯片-算法协同设计提升计算效率。

更具泛化能力的RL：当前主流的RLVR范式虽在数学与代码领域表现优异，但依赖人工构造可验证环境的限制日益明显。今年我们将探索更通用的强化学习范式，使AI不仅能执行人类指令下的特定任务，更能理解并完成持续数小时乃至数天的长周期任务。

持续学习与自主进化：最具挑战性的探索方向。目前主流AI模型一旦部署，其智能基本处于静态状态，依赖一次性、高成本训练获得知识，随后逐渐过时。这与人脑通过持续交互不断学习和进化的方式截然不同。我们必须前瞻性布局下一代学习范式——在线学习（Online Learning）或持续学习（Continual Learning）。

我们不是一家传统公司，也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生企业：打造智能持续提升的下一代模型，研发以AI为核心的产品服务用户，让AI成为每个人最得力的助手，协助完成各类任务。我们还希望通过AI参与公司治理，实现降本增效与更公平的管理。

随着时间推移，企业容易陷入重复劳动和渐进式改进，从而限制创新能力。但在AI时代，一切都在发生变革式演进，我们需要保持些许“不适感”，才能激发创造力，提出革命性构想，开拓下一个增长蓝海。

因此，我们在智谱内部设立全新部门X-Lab，致力于以开放方式汇聚更多年轻人才，开展前沿探索，涵盖全新模型架构、新认知范式，并孵化跨软硬件领域的新项目。

同时，我们将扩大对外投资，不仅深化与现有被投企业的战略合作，还将开拓新领域，打通产业链条，推动整个生态协同发展。在X-Lab，每位成员的使命都是进行完全颠覆式的创新，始终回归AGI的核心主线。

今天是智谱生命中激动人心的一天，是公司历史上的重要里程碑，更是开启全新时代的起点。我非常喜欢Z.ai这个品牌标识，Z是字母表的最后一个字母，象征终极境地。我们希望在AGI探索之路上，不断迈向智能的极限，这是我们不懈追求的目标。我们满怀期待：

拥有一项雄心勃勃、改变世界的事业
着眼长远利益，放眼未来格局
更加专注，深入探索AGI的本质
用AI赋能杰出企业家与企业的蓬勃发展
以更精准的预判把握企业发展机遇
最终，为人类社会带来不一样的AI，切实推动人类福祉的进步

这是一个无与伦比的喜悦时刻，这种开心并非短暂的多巴胺释放，而是探索AGI之路上积累而成的内啡肽，让我们更加专注、脚踏实地、持续前行！

唐杰

2026.1.8

智谱上市，CSO唐杰发全员信要求全面回归基础模型研究

猜你喜欢