今早!小鹏蔚来智驾换帅,WA逆袭,VLA真要“绝唱”?

智驾领域的“吴宫争宠”:当“世界模型”遇上“语言中介”,谁才是赢家?

10月的秋风,吹散了国庆假期的喧嚣,却吹醒了汽车界一场暗流涌动的技术变革。

小鹏和蔚来,这两位曾经的“造车新势力”代表,几乎在同一时间上演了“人事地震”。

小鹏自动驾驶中心一把手悄然易主,曾负责“世界基座模型(WA)”的刘先明,直接登上了1号位,而原先的VLA(视觉-语言-行为)路线掌舵者则退居二线。

几乎是同一天,蔚来智驾部门三位核心高管离职,官方给出的理由是“吸收通用AI最新技术”。

这番操作,放在一起看,意味深长。

两家公司,不约而同地将“世界模型2.0”写入了他们的技术蓝图。

曾经热闹非凡的VLA派,如今似乎只剩下理想一家在“单打独斗”。

小鹏从VLA转向WA,这不仅仅是人事变动,更是智驾技术路线之争进入了“生死时速”的信号。

今早!小鹏蔚来智驾换帅,WA逆袭,VLA真要“绝唱”?-有驾

VLA:解释性强的“翻译官”,还是效率低下的“慢半拍”?

让我们先来看看,这场争论的核心——VLA和WA,究竟是何方神圣?

VLA,简单来说,就像一个需要“翻译”的大脑。

它首先“看见”路况,比如“前方有行人”,然后通过一个“语言模块”去理解,形成“前方有行人”这个概念,最后才发出“减速”的指令。

今早!小鹏蔚来智驾换帅,WA逆袭,VLA真要“绝唱”?-有驾

这套系统的优点显而易见:解释性强。

在面对监管机构的质询时,它能清晰地告诉你“为什么要做这个决定”,就像一位严谨的学者,条理分明。

想想看,如果一个“自动驾驶系统”在关键时刻突然刹车,你能清楚地知道它是看到了什么,理解了什么,最后做出了什么判断,这无疑会大大增加人们的信任感。

然而,正如“欲速则不达”,这冗长的“视觉-语言-行为”链路,也带来了潜在的弊端。

每一个环节都可能产生误差,信息在传递过程中不断累积损耗,最终导致的是反应时间的延迟。

当车辆在高速行驶,或者在复杂的城市路况下,哪怕是零点几秒的延迟,都可能带来不可估量的后果。

这就像一位健谈的朋友,虽然能把事情说得头头是道,但当你急需一个干脆利落的答案时,他可能还在组织语言。

WA:直抵行动的“特种兵”,还是数据与算力的“吞金兽”?

再来看看WA,世界基座模型。

它更像是一位训练有素的“特种兵”,直接将“看见”的点云数据与“行为”控制精准映射。

它不经过“语言”这个中间环节,而是直接预测下一帧的场景状态,然后输出转向、加速、刹车等指令。

今早!小鹏蔚来智驾换帅,WA逆袭,VLA真要“绝唱”?-有驾

这条“视觉-行为”的直连通道,无疑大大缩短了反应时间,理论上能达到更高的性能上限。

这就像一个经验丰富的赛车手,他不需要思考,只需要凭借本能和对赛道的熟悉,就能做出最精准的操作。

笔者的经验告诉我,这种“端到端”的模式,潜力巨大。

它能将感知信息直接转化为驾驶动作,省去了中间的“翻译”过程,效率自然更高。

然而,这光鲜的背后,是对海量数据和强大算力的极致渴求。

它需要源源不断的高质量数据来“喂养”模型,还需要顶级的计算平台来支撑其运行。

这如同一个天才棋手,需要无数的对弈来磨练技艺,也需要强大的运算能力来推演棋局。

小鹏与蔚来的“换帅”,是战略抉择还是无奈之举?

小鹏和蔚来,这两家公司在此时进行人事上的重大调整,绝非偶然。

小鹏将WA的负责人推到自动驾驶的1号位,这释放出一个强烈信号:WA路线将从“预研”阶段,正式迈入“量产主航道”。

刘先明博士的履历——曾任职Facebook和Cruise,专攻机器学习与计算机视觉——为这一战略转型提供了坚实的学术与实践基础。

再看看蔚来,三位核心高管的离职,官方虽称是为了“吸收通用AI最新技术”,但其构建的“预研-量产-平台复制-车型复制”的4x100接力棒模式,实质上就是将智驾部门与通用AI深度融合,为WA 2.0的迭代铺平道路。

这两家公司的举动,与华为车BU CEO靳玉志的观点不谋而合,都指向了同一个方向:VLA只是一个“过渡方案”,而WA才是实现大规模量产的“终点”。

成本与订阅:WA路线的商业“双刃剑”

为何大多数车企都在向WA路线靠拢?

答案很简单:成本与商业模式。

VLA路线需要额外的语言模型参数,对算力要求更高。

据测算,Orin-X芯片上的算力占用可能高达30%。

而WA,仅用卷积加Transformer架构,就能将算力占用降低一半。

这意味着,城市NOA的硬件成本有望压低到万元级别。

小鹏拥有庞大的实路和仿真数据,WA正好能将其转化为“下一帧世界”的预测能力,大幅降低了Corner Case的训练成本。

内部“军令状”的出现——“2025年Q1城市NOA订阅包1万元”,更是将这一商业目标摆在了台面上。

蔚来同样看到了WA在订阅化方面的潜力。

VLA的语言模块难以精准地按功能拆分订阅,而WA则可以将高速NOA、城市NOA、自动泊车等功能,独立打包成“世界模型”,按月或按功能收费。

这种精细化的收费模式,能为蔚来带来更稳定的现金流。

同时,WA能让蔚来NT3.0的Thor-U芯片实现全场景覆盖,避免了VLA多模型切换带来的算力浪费。

理想的“坚守”,是固守阵地还是饮鸩止渴?

在这场WA的浪潮中,理想汽车显得有些“形单影只”。

他们依然坚定地走在VLA技术路线上。

VLA的强解释性,在当前的L3准入申报中,确实具有一定优势,便于向监管部门解释“减速”的逻辑。

Mind GPT的加持,也能实现“驾驶+座舱”的统一语言模型。

然而,理想汽车也面临着严峻的挑战。

当城市NOA的成本被压低到万元级别时,VLA路线的成本劣势将愈发明显。

在未来,当用户习惯了按需付费,并且对车辆的反应速度有了更高要求时,VLA的“慢半拍”是否还能成为其护城河?

这是一个值得深思的问题。

未来已来:WA的时代,VLA的“绝唱”?

“世界模型”的争夺,本质上是一场关于效率、成本和商业模式的博弈。

WA的“视觉即行为”模式,绕过了语言中介,实现了更快的响应速度。

当自动驾驶的接管里程不断攀升,从百公里到千公里,这种延迟优势将愈发凸显。

正如“士别三日,当刮目相看”,技术的发展日新月异。

2025年,WA在“直接映射到行动”方面的优势,注定会被无限放大。

VLA或许不会完全消失,它可能会在特定场景下,如监管汇报、复杂场景下的解释说明等,继续发挥其“翻译官”的作用。

但从量产和商业化的角度来看,WA才是那条通往未来的康庄大道。

这场智驾技术的“三国杀”,远未结束。

但从目前的趋势来看,WA路线已经占据了先机,而VLA,或许即将迎来它的“绝唱”。

0

全部评论 (0)

暂无评论