物理AI浪潮下,小鹏、特斯拉正在验证同一个答案

撰文 | 李信马

最近,物理AI(Physical AI)火了!

这一概念指代的是具备理解与适应物理世界能力的AI系统。它突破了传统AI仅处理数字信息的局限,能够感知真实环境、理解物理规律,并通过实体载体与现实世界进行交互。

不久前,小鹏汽车创始人何小鹏开启了一场美国之行,并在社交平台分享了他对物理AI的深刻见解。

我认为未来3年,最有可能有大突破的不一定是在数字世界(可以很明显看到OpenAI虽然核心在说AGI,但是全力在做业务落地。当然,期待下一个Transformer或者训练费用的巨大下行),反而有可能在物理AI领域会产生大变局,例如自动驾驶会直接到达准L4或完整L4;人形机器人会实现从类自动驾驶的L1到L4初阶的快速跨越,这些反而会产生巨大的突破。物理AI的发展速度会比数字AI慢,但是改变我们生活的力度会更大。

他所提到的“物理AI领域的大变局”,目前距离大众最近、影响最广的便是自动驾驶技术的跃迁。这也是何小鹏此次赴美的核心行程——重测特斯拉FSD V14并体验其Robotaxi。

在自动驾驶赛道上,中美企业正齐头并进。特斯拉作为美国领军者,而中国方面,小鹏汽车于11月5日的科技日上围绕“物理AI”发布了四项重要成果:第二代VLA、小鹏Robotaxi、全新一代IRON,以及汇天两套飞行体系,且均已制定明确的量产计划。

他山之石可以攻玉,企业一号位亲自下场体验与对比全球顶尖技术,有助于更清晰地判断自动驾驶的发展方向,以及行业迈向L4的真实进度。

01.

与全球顶尖并肩

2024年,何小鹏曾赴美测试特斯拉FSD V12。相较此前,此次试驾FSD V14的感受有了显著不同。

“FSD从一年多前处于L2高阶辅助驾驶的丝滑体验,现在已经进入了(软件)准L4的安心阶段,在硅谷和三藩的约5个小时试驾中,标准车辆和RoboTaxi完全用一个模型表现如一,安心平稳,虽然有瑕疵,但是大幅度超过去年的水准。”

对何小鹏而言,这次试驾最大的价值在于坚定了一个信念:未来将由同一套自驾系统、同一套硬件架构支撑,实现从L2直达L4的跨越式演进。

自动驾驶分为L0至L5六个等级,其中L4意味着在绝大多数场景下车辆可自主完成驾驶任务,是Robotaxi实现商业化的关键阶段。近年来,随着AI技术突飞猛进,“端到端”成为自动驾驶的新范式。相比传统分模块设计,“端到端”采用统一模型直接学习从感知输入到控制输出的映射,更加贴近人类驾驶逻辑。

特斯拉正是这一路线的代表企业。

2024年4月,特斯拉CEO马斯克宣布将推出Robotaxi产品,并于同年10月发布定位L4的Cybercab。他在多次财报会议、访谈及X平台发言中阐述了特斯拉的技术路径:

以端到端、纯视觉的大模型,基于海量行车视频训练“从像素到转向”的通用驾驶策略;

车即移动机器人,Robotaxi与人形机器人Optimus共享同一技术栈;

数据闭环与规模是核心优势,依赖数百万辆实车采集的真实数据持续迭代,而非依赖高精地图或规则堆叠;

算力与训练基础设施(Dojo+NVIDIA)构成技术护城河;

安全需通过大规模真实场景验证与可审计事件数据来证明;

长期目标是让特斯拉成为“实世界AI公司”,以FSD与Robotaxi验证通用物理AI在复杂开放环境中的能力。

如今,这条技术路线的可行性已初步得到验证。而有趣的是,小鹏汽车或许是目前最接近特斯拉的中国车企。

首先,双方技术路线高度一致。在2025年的小鹏科技日上,小鹏正式发布第二代VLA,取消了“语言转译”环节,实现了从视觉信号到动作指令的端到端生成,在拟人化和能力涌现方面与FSD表现出相似特性。

11月中旬,何小鹏在广州试驾搭载第二代VLA的小鹏X9,在夜间极端复杂路况下,车辆可在狭窄巷道中自主避障、精准绕行;面对频繁加塞的主干道,也能平顺变道与跟车。

从美国归来后,何小鹏立即展开“查作业”式对比测试,在九大典型场景中评估第二代VLA的表现。尽管中国路况远比美国复杂,但该系统在多个场景下展现出高度流畅性、稳定性和类人的博弈能力。

视频显示,当人行道出现电动两轮车时,系统能迅速识别并避让;遇到施工区域自动切换至对向车道并及时回归;经过行人密集区会主动减速缓行;进出环岛时控速更为精准。对此,何小鹏自豪表示:“我们上次全力以赴憋了个大招,希望大家能一口气看到从L2到L4的跳跃。”

这份自信也延续到了他在硅谷年会的演讲中:“我们要把自动驾驶做到全球,所以这是为什么我赌 VLA,因为 VLA 对复杂路况最优,我一定要做到全球去。”

何小鹏坦言,当前VLA尚未完全达到FSD V14.2的全部能力,但他预测到明年8月底,VLA在国内的整体表现将达到FSD V14.2在硅谷的水平。“若无法实现,我们的自动驾驶Head Xianming同学,承诺在金门大桥裸跑”,何小鹏在微博写道。

其次,在算力与训练基建方面,小鹏已建成3万卡规模的云端算力集群,成功部署参数规模达720亿的超大规模基座模型,支持每五天一次的全链路迭代。

第三,目前全球仅有特斯拉与小鹏两家整车厂商大规模量产纯视觉方案,并拥有来自百万级车队的真实数据用于算法迭代。

最后,小鹏不仅具备“大算力+大数据+大模型”的组合优势,还实现了核心软硬件全栈自研,在芯片、具身智能、飞行汽车等领域均有布局,有望在未来构建物理AI领域的多元化应用生态。

值得一提的是,马斯克近期在播客中透露特斯拉正在研发飞行汽车原型机,而小鹏汇天飞行汽车量产工厂已启动试产,并成功下线首台“陆地航母”飞行器,全球订单突破7000台,计划于2026年实现量产交付。在机器人领域,小鹏亦早于特斯拉展开探索,聚焦通用性强、数据获取便捷的人形机器人方向。

据悉,小鹏汽车已在广州市获得L3级自动驾驶道路测试牌照,并启动常态化L3测试,面向L4的第二代VLA将于2026年正式量产上车。

先行者往往孤独。特斯拉与小鹏都曾面临质疑,却一次次用成果证明了自身技术路线的正确性。随着物理AI浪潮席卷而来,两家公司正从少数派走向“真理”派,引领整个行业的变革。

02.

Robotaxi:新范式崛起

技术与商业如同一枚硬币的两面:先进技术推动商业成功,商业回报反哺技术创新。L4级自动驾驶最重要的商业化场景正是Robotaxi,这也成为各大厂商必争的战略高地。

在海外市场,特斯拉已然抢占先机。那么,谁将成为“中国的特斯拉”?

参与竞争的既有元戎启行、小马智行等专业自动驾驶公司,也有百度等互联网巨头。而作为整车制造商的小鹏汽车,则在今年11月初宣布将推出三款Robotaxi产品。

这一节奏显然与其第二代VLA的量产进程紧密协同。

小鹏的Robotaxi从设计之初就为L4而生。当前行业主流方案多为后装改造——在量产车上加装传感器,成本高昂且难以规模化。而小鹏采用前装量产模式,无需改装,成本可控,更利于大规模推广。

硬件层面,小鹏Robotaxi将搭载4颗自研图灵AI芯片,实现高达3000TOPS的车载算力,位居全球前列。同时预埋双冗余硬件架构,两套系统互为备份,一旦主系统失效可瞬时切换。

软件层面,强大的本地算力支持超低延迟交互,依托第二代VLA与VLM模型,可在边缘端实现泛化学习,提升系统通用性与全球部署效率。此外,系统还能通过可视化提示与行人互动,未来还将融合车外语音功能,打造视觉与听觉结合的多维交互体验。

正如前文所述,特斯拉与小鹏坚持“端到端+纯视觉”路线,已被实践验证。而行业内许多玩家仍依赖激光雷达与高精地图的传统规则化方案,在泛化能力和应对长尾问题上存在天然短板。

据高盛报告预测,中国自动驾驶市场规模将从2025年的5400万美元增长至2035年的470亿美元,有望成为全球最大自动驾驶出行市场。瑞士银行预计,到2030年底,中国Robotaxi车队规模或将达到400万辆;若实现全国部署,整体市场规模可达1800亿至2000亿美元。

若有一家企业能被公认为“中国的特斯拉”,其估值将迎来飞跃。事实上,多家机构已上调小鹏汽车估值。长江证券在研报中指出,当前小鹏正处于“强新车+强AI”周期,是国内最早构建“AI汽车+AI机器人+飞行汽车”生态体系的企业之一,对标特斯拉,未来估值提升空间广阔。

招商证券国际亦认为,小鹏汽车已形成类似特斯拉的产业链布局,智能化部分的估值目前被低估。

展望2026年,若小鹏汽车凭借“纯视觉+数据驱动+前装量产”的新范式,成功突破成本、规模与泛化能力三大瓶颈,实现Robotaxi的规模化商业落地,将有望引领物理AI在交通出行领域的深度发展,助力中国科技在全球舞台上实现逆袭。