智谱上市,CSO唐杰发全员信要求全面回归基础模型研究
SmartHey1月8日消息,今天上午,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股 116.20 港元(现汇率约合 104.5 元人民币),开盘报 120 港元 / 股,市值突破 528 亿港元。
据“晚点LatePost”获取的清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰内部信,智谱很快将推出新一代模型 GLM-5。
唐杰在信中提到,今天是“智谱生命中激动人心的一天”。智谱 2025 年如期完成了年初定下的战略,即 4 月发布一个“稳住阵脚”的模型、年中发布一个“上牌桌”的模型(成为 one of the best)、年底发布一个 Top 1 的模型。
内部信还介绍了智谱今年将聚焦的三个技术方向:全新的模型架构设计,更通用的 RL(强化学习)范式,以及对模型持续学习与自主进化的探索,这三个方向均围绕基础模型能力提升展开。
唐杰透露,智谱内部设立了一个全新部门 X-Lab,将致力于以开放方式聚集更多年轻人开展前沿性探索,包括研发全新模型架构、探索新的认知范式,并孵化新项目,不局限于软件或硬件领域。
“同时,我们也会扩大对外投资,不仅仅是战略联合已有的被投企业,也要开辟新的版图,让整个行业贯通起来,让整个生态一起繁荣。在 X-Lab,每个人的使命就是做完全颠覆式的创新,最终回归到 AGI 的主线。”
以下是唐杰内部信全文:
用“咖啡”的精神做 AGI
在香港科技大学做短期访问时,和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝得太多,感觉有点上瘾,需要戒一戒了。
杨老师说:“为什么要戒呢?上瘾也不一定是坏事呀,如果我们做研究能像喝咖啡一样上瘾,又何愁研究做不好呢?”
是啊,“上瘾”便是人生的精彩所在,无论是研究,还是其他事情,只要专注、努力,就一定能做好。
“让机器像人一样思考”是智谱自始至终的愿景和理想,也是智谱人持之以恒奋斗的唯一目标。
2018年底,在人脑认知的双系统理论启发下,我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱,开始尝试探索AGI,实现“让机器像人一样思考”的宏伟愿景。
这里的最大挑战可能是直到今天也没有人——包括我们自己——能够给出一个准确的AGI定义以及如何实现AGI的技术路径,也许这正是探索AGI的魅力所在。
我们正处在一个历史上前所未有的非凡时刻,一个技术再次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座,更有望成为驱动生产力变革的核心引擎。
回顾一路走来的历程,我们能走到今天的一个重要原因,是我们始终坚持做让用户真正用得上的AI技术。只有真正有人使用的理论、技术或产品,才能最终成为AGI之路上的重要成就。当然,并非所有创新都能成功,我们也曾有不少高风险项目以失败告终,但这些经历往往教会我们从失败中汲取力量,这让智谱变得更强大,对AGI的理解也更加深刻。
更重要的是,这让我们在注重实用性的同时,不再只盯着短期收益:帮助用户、助力国家发展、推动全球科技进步,已成为智谱的长期目标。
2020年,我们推出了自研的大模型算法架构GLM,并开始训练100亿参数的基座模型。该模型取得了成功,获得了包括美团在内的多家企业试用。这是一个大胆的尝试,因为在当时仍是BERT主导的小模型时代。尽管如此,当时的成果距离我们梦想中的AGI仍遥不可及,部分原因是模型知识量不足,另一部分则是模型尚不具备类人的推理能力。
2021到2022年,大模型的发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月计划的宏大构想,也不认为这是重大技术变革的机会,或者因害怕失败而却步。但我们仍决定冒险一搏,使用更多数据训练一个1300亿参数的大模型。
这一决策极具挑战性,因为它不能影响公司整体发展节奏。为此,我们成立了两个独立的小型创新团队:一个专注于模型训练,即后来被称为GLM三剑客的团队;另一个则独立负责MaaS平台建设。当时这两个小团队甚至彼此不知对方的存在。
2022年中,GLM-130B成功训练完成,其中多项精细设计引起全球关注;与此同时,MaaS平台上线(即现在的bigmodel.cn),迎来了第一批真正的API用户。随后,我们正式成立AI研究院,专注下一代大模型研发;并设立MaaS平台部,负责对外提供大模型API服务。有时候,我们需要找到足够有梦想的人(甚至专门投入精力去寻找),一个宏大目标或许已经决定了半数的成功。
2023年,我与国内一位顶尖创业前辈(其实他比我年轻不少)探讨AI对未来的影响,我们一致认为AI将颠覆搜索、颠覆浏览器,为每个人带来全新的AI助手;甚至在拥有AI助手之后,我们可能不再需要传统应用商店,反而需要为AI打造一个“API商店”,其底层逻辑或将重塑现有操作系统;更深远的颠覆可能是计算机本身——届时我们或许不再需要为人设计的计算机,而是专为AI优化的新架构。
这一变革的意义将是深远的,因为它将彻底重塑计算机的底层逻辑,挑战计算机界沿用80年的奠基石——冯诺伊曼体系。聊到这里时,我们都不约而同地感到,我们对AI的投入还远远不够,尚未真正做到All-in。
现实是残酷的,All-in不仅需要坚定的信念,还需要强大的资金与团队支持,以及精准的未来预判。2023至2024年是全球大模型爆发之年,各大厂商纷纷“All-in”大模型,国内也掀起创业热潮,百模大战、各类AI助手层出不穷。
那段时间我们或许也有失误,无论是在技术还是商业层面。现在复盘来看,可能的原因是在追逐AGI的路上有所迷失,被眼前的短期收益和热闹氛围所迷惑。AGI是一场技术变革,技术应是平权的、公开透明的,要让所有人都能使用并从中受益。
随后DeepSeek的出现警醒了我们。文锋在2023年创业前曾与我交流,当时我并未意识到他对AGI如此执着,感谢他带给我许多全新的思考。选择对AGI技术的执着追求,不断探索其能力边界,同时做出精准的未来判断,是下一步智谱需要持续改进和升华的方向。这两年让我们经历了诸多考验,更重要的是通过“强化学习”深化了我们对AGI、公司治理和商业竞争的认知。
过去一年,我们进行了一次系统的“强化”。我们提出“定力”与“成就”的口号,要求全员保持定力,不骄不躁,不妄自菲薄,专注于把手头的事情做到极致,成就自我。
年初时,一切都很艰难:模型效果未达预期,全国范围内价格战激烈,突围亟需精准突破口。
我们坚守阵地,最终选定Coding作为突破口。
如果说4月GLM-4.1的发布只是象征性的试探,那么7月底发布的GLM-4.5几乎是一场决战。所有技术、平台和业务团队都高度紧张,日夜奋战,终于迎来久违的胜利。随后GLM-4.6和GLM-4.7使我们的模型能力与国际顶尖水平并驾齐驱。
我们的GLM-4.7在AA、竞技场等多项评测中取得开源模型、国产模型的SOTA成绩,用户反馈在Coding和Agent方面的实际体验也非常出色。全球184个国家的15万名开发者使用GLM Coding Plan,GLM-4.7发布后,MaaS平台ARR年化收入突破5亿元(其中海外收入超2亿元),从2000万元增长至5亿元(25倍)仅用10个月。
总体而言,在模型侧我们如期完成了年初制定的战略目标:4月发布“稳住阵脚”的模型、年中发布“上牌桌”的模型(one of the best)、年底发布Top 1模型。这为我们后续冲刺AGI技术高地奠定了坚实基础。
我们的「主权AI」也取得新进展:马来西亚国家级MaaS平台基于Z.ai开源模型构建,GLM已成为该国的国民级模型。“主权AI出海”是我参加总书记座谈会后受“中国AI要走出国门”讲话感召而推动的方向,说实话起初并不知如何着手,但我们的国际团队敢拼敢打,完成了中国大模型从无到有出海的里程碑。业务方面,我们敢于竞争,再次实现年度营收同比增长超一倍的目标。
在重重困难与机遇并存的背景下,今天,我们以一种几乎不可能的姿态成为“全球大模型第一股”,这标志着市场对我们技术价值与商业模式的高度认可。“Make impossible possible”——还记得我们曾经说过的话吗?
这一年来,蜕变最大的或许不是智谱本身,而是一群奋战在一线的年轻人,他们把许多看似不可能的事,真正变成了现实。
2026年,公司的目标是成为国际领先的大模型企业。过去一年,关于大模型的讨论多集中于应用场景与生态系统。
真正决定下一阶段格局的,仍是两个更底层的问题——模型架构与学习范式。同时,应用层面可能出现清晰趋势:2026年或将成为AI替代各类工种与任务的爆发之年。
基于这一判断,我们在2026年将聚焦以下方向:
GLM-5:新一代模型GLM-5即将面世,通过进一步Scaling和多项技术创新,相信它将带来全新体验,帮助AI完成更多真实任务。
全新模型架构设计:已广泛应用近十年的Transformer架构已显现出局限,如超长上下文计算开销大、记忆机制薄弱、更新机制效率低等。我们需要探索全新架构,发现新的Scaling规律,并通过芯片-算法协同设计提升计算效率。
更具泛化能力的RL:当前主流的RLVR范式虽在数学与代码领域表现优异,但依赖人工构造可验证环境的限制日益明显。今年我们将探索更通用的强化学习范式,使AI不仅能执行人类指令下的特定任务,更能理解并完成持续数小时乃至数天的长周期任务。
持续学习与自主进化:最具挑战性的探索方向。目前主流AI模型一旦部署,其智能基本处于静态状态,依赖一次性、高成本训练获得知识,随后逐渐过时。这与人脑通过持续交互不断学习和进化的方式截然不同。我们必须前瞻性布局下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)。
我们不是一家传统公司,也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生企业:打造智能持续提升的下一代模型,研发以AI为核心的产品服务用户,让AI成为每个人最得力的助手,协助完成各类任务。我们还希望通过AI参与公司治理,实现降本增效与更公平的管理。
随着时间推移,企业容易陷入重复劳动和渐进式改进,从而限制创新能力。但在AI时代,一切都在发生变革式演进,我们需要保持些许“不适感”,才能激发创造力,提出革命性构想,开拓下一个增长蓝海。
因此,我们在智谱内部设立全新部门X-Lab,致力于以开放方式汇聚更多年轻人才,开展前沿探索,涵盖全新模型架构、新认知范式,并孵化跨软硬件领域的新项目。
同时,我们将扩大对外投资,不仅深化与现有被投企业的战略合作,还将开拓新领域,打通产业链条,推动整个生态协同发展。在X-Lab,每位成员的使命都是进行完全颠覆式的创新,始终回归AGI的核心主线。
今天是智谱生命中激动人心的一天,是公司历史上的重要里程碑,更是开启全新时代的起点。我非常喜欢Z.ai这个品牌标识,Z是字母表的最后一个字母,象征终极境地。我们希望在AGI探索之路上,不断迈向智能的极限,这是我们不懈追求的目标。我们满怀期待:
- 拥有一项雄心勃勃、改变世界的事业
- 着眼长远利益,放眼未来格局
- 更加专注,深入探索AGI的本质
- 用AI赋能杰出企业家与企业的蓬勃发展
- 以更精准的预判把握企业发展机遇
- 最终,为人类社会带来不一样的AI,切实推动人类福祉的进步
这是一个无与伦比的喜悦时刻,这种开心并非短暂的多巴胺释放,而是探索AGI之路上积累而成的内啡肽,让我们更加专注、脚踏实地、持续前行!
唐杰
2026.1.8
