12月初,魏牌蓝山搞了个大动作,全系标配一个叫VLA的新玩意儿,号称能让车提前看穿危险。这话听着就玄乎,又是哪家车企在吹牛皮?
结果仔细一扒,发现长城这次真没瞎说。11月21日广州车展上,长城发布VLA辅助驾驶大模型,并且宣布魏牌蓝山成为首搭车型。人家没藏着掖着,技术细节全摆出来了,这套系统能在路口大车挡住视线时,像老司机一样提前判断盲区后面可能蹿出来的车,提前减速留出空间。
这么牛的技术首发居然不是给坦克或者哈弗旗舰,而是给了20万出头的魏牌蓝山这款家用插混SUV?
12月1日,长城CTO吴会肖官宣蓝山智能进阶版成为VLA首搭车型。网友们瞬间炸锅,长城这是要硬刚特斯拉FSD?提前预判危险,这不是武侠小说里的未卜先知?魏牌蓝山要翻身了?
今天咱就来好好扒一扒,这个VLA到底是真突破还是新概念?长城凭啥敢说自家智驾能看见看不见的危险?
VLA凭啥能看穿盲区后面的危险?
说到VLA这个词儿,估计十个人有九个半没听过。这玩意儿全称叫VisionLanguageAction,翻译过来就是视觉语言动作模型。听着拗口,但简单讲就是让车既能看,又能懂,还能动,把人类老司机的思考流程,全塞进AI的脑子里。
咱们先说说传统智驾是咋干活的。就像工厂流水线,摄像头负责看路,雷达负责测距,然后把数据扔给规划模块,规划模块再告诉执行模块该往哪儿打方向盘。整个流程看着挺有条理,但问题在于,几个模块之间传话,传来传去误差就累积了,而且遇到没见过的情况就懵了。
但VLA不一样。长城这套系统最牛的地方在哪儿?就是能像开了二十年车的老司机一样预判。举个实际例子,前方路口有辆大货车完全挡住了你的视线,传统智驾看不见就是看不见,只能等危险真出现了再踩刹车。但VLA会怎么想?它会琢磨,大货车后面可能藏着电动车或者行人,我得提前减速,留出反应时间。
这套逻辑听着简单,但实现起来可不容易。长城VLA辅助驾驶大模型具备听得懂指令、看见看不见的危险、会思考推理、可托付信任四大核心能力。就是第二点,看见看不见的危险。这可不是玩文字游戏,而是真的融入了防御性驾驶意识。
系统会在中控屏上实时显示思维链卡片,把每一次加速、减速、转向背后的思考过程全展示出来。啥意思?就是AI会告诉你它在想啥。比如前方路口视线受阻,可能有横向来车,建议减速至30km/h。这就像驾校教练坐在副驾,随时给你讲解操作逻辑。
从技术原理看,VLA的工作流程分三步。第一步视觉编码器对周围环境进行识别和分类,第二步语言模型把你的指令和路况信息结合起来推理,第三步策略模块把高级目标转化成方向盘角度和油门刹车动作。整个过程就像人脑处理信息,眼睛看、大脑想、手脚动,一气呵成。
那么问题来了,这东西真靠谱吗?
从实际测试来看,效果确实有点东西。直播测试中,车辆前方窜出一辆不打转向灯就加塞的车,VLA系统立马开启防御性驾驶,自动拉开车距。长城CTO吴会肖说了句很有意思的话,防御性驾驶的目的是让系统学会害怕,这是长城VLA核心的价值。
学会害怕这四个字听着有点反直觉,但细品确实有道理。
不怕死的AI是危险的,会害怕、懂得规避风险的AI,才是真正把安全放在第一位。这就像武功高手不是不会输,而是知道什么时候该躲、什么时候该硬刚。
VLA这技术从哪儿冒出来的?为啥现在才火?
说起VLA的起源,还得从机器人圈儿说起。2023年7月28日,谷歌DeepMind搞出了全球第一个能控制机器人的视觉语言动作模型。当时这技术是让机器人能听懂人话、看懂环境,然后自己完成任务。比如你说帮我拿个杯子,机器人就能找到杯子递给你。
那为啥汽车行业现在才开始玩这个?
说白了,就是硬件之前跟不上。VLA模型对算力要求高得吓人,得同时处理视频、语言、决策,还得在100毫秒内给出反应。这对车载芯片来说,简直就是噩梦级别的挑战。
现在市面上的高阶智驾,算力都是2颗英伟达OrinX芯片撑着,总算力在508Tops左右。这点算力跑传统规则系统还行,但要跑VLA这种大模型?那就是小马拉大车了。但技术进步就是这么快,英伟达新一代车载AI芯片Thor单片算力就能达到1000Tops,这才让VLA上车成为可能。
长城这次也是下了血本。全新蓝山智能进阶版全车搭载了27个智慧传感器,并且采用NVIDIA DRIVE ThorU芯片,算力实现了176%的冗余提升。27个传感器是啥概念?相当于给车装了27只眼睛,360度无死角监控周围环境。而且算力冗余176%,意味着就算部分芯片出问题,系统照样能运行。
但光有硬件还不够,软件算法才是灵魂。长城在辅助驾驶上的研发投入非常激进,十多年前就从主动安全部门分出一波人专门搞智驾。这种技术积累不是一朝一夕能完成的。2022和2023年,当整个行业还在死磕高精地图方案时,长城All in无图路线。这个决策在当时看挺冒险,但现在来看确实走对了路。
从技术路线看,VLA其实是端到端和VLM视觉语言模型的进化形态,被业内称为端到端大模型2.0。传统VLM或端到端方案通常只能应对7秒内的路况推理,但VLA模型能够对几十秒的路况进行推理。从7秒到几十秒,这个跨越可不小,意味着车能想得远,应对复杂的场景。
还有个点得说,可解释性。
VLA亮点就是可解释,传统规则系统或者初代端到端模型就像个黑箱,你根本不知道它为啥这么开。但VLA借助大语言模型的推理能力,能用人类能理解的方式解释每个动作背后的逻辑。这就解决了用户担心的问题,我得知道AI为啥这么干,它是真聪明还是在瞎搞?
从产业趋势看,2025年被称为VLA上车元年。理想、小鹏等车企都在推进VLA路线,只是长城动作比较快而已。有头部新势力的VLA模型预计2026年才能上车。所以这不是长城独有的技术,而是整个行业都在往这个方向走。谁能先把技术做成熟、落地快,谁就能抢到先机。
长城为啥把这么牛的技术首发给了魏牌蓝山?
这个问题确实挺反常识的。按理说,这么牛的技术应该先给旗舰车型用,比如坦克500或者哈弗H9。但长城偏偏选了魏牌蓝山这款20万出头的家用SUV,这背后到底打的啥算盘?
长城CTO吴会肖给出的解释是,魏牌承载着家庭用户的信任,VLA放到不能出错的全新蓝山上来证明自己。这话听着有点绕,但细品还真是这么回事儿。家用车和越野车不一样,越野车用户能接受一点小毛病,大不了自己动手修。但家用车用户对安全的要求是零容忍,老婆孩子都在车上,谁敢拿安全开玩笑?
从销量数据看,蓝山自上市以来累计交付已超过11万辆,魏牌整体销量同比暴涨200%。这个销量说明啥?说明蓝山已经有了足够大的用户基数,能提供海量的实际道路数据。真实世界的数据涵盖各种天气、光线、行人行为等变量,只有依靠量产车的大规模部署才能积累起来。
这就像养蛊一样,用户越多,跑的路况越复杂,收集到的数据就越丰富,AI就越聪明。长城这是拿蓝山当数据收割机用,让VLA在复杂的真实场景中快速成长。等技术成熟了,再往其他车型上铺,这策略确实挺精明。
从产品定位看,魏牌面向家庭用户,瞄准的是高端新能源市场。这个定位其实挺聪明,家庭用户对智驾的需求旺盛,因为长途出行、接送孩子、上下班通勤,这些场景都需要智驾来减轻负担。而且家庭用户对价格相对敏感,20万价位段是主流市场的甜蜜点。
还有个深层次原因,压力测试。长城CTO吴会肖透露了个细节,CP Master系统的招手即停功能,在上车前被坚决砍掉了。为啥?因为无法忽视的潜在风险。这个细节很说明问题,长城不是为了炫技,而是真正把安全放在第一位。那些花里胡哨的功能,只要有一丝安全隐患,砍掉,绝不含糊。
从市场策略看,CP Master凭借VLA大模型的加持,特别是可解释的思维链功能,在主流车企的智驾方案中形成了差异化特色。这招确实高明,别家都在卷硬件、卷算力,长城从用户体验切入,让用户看得懂、信得过。这种差异化竞争,往往比单纯的参数内卷有杀伤力。
长城汽车在过去5年研发投入从2020年的51.5亿元增长至2024年的95亿元。这个投入力度说明啥?说明长城是真把智驾当战略重点来抓,不是玩玩概念就算了。而且2025年长城集团研发费用同比增长25%,重点投向人工智能和新能源领域。这钱花得值不值,还得看市场反馈。
网友们都在担心啥?VLA到底靠不靠谱?
自从长城发布VLA之后,网上的讨论就没停过。咱们来看看大家都在关心啥问题,这些担忧有没有道理。
有人问,VLA这么牛,为啥别的车企不用?
这问题问到点子上了。其实不是别家不想用,而是大家都在憋大招。2025年被称为VLA上车元年,理想、小鹏等车企都在推进VLA路线。长城只是动作比较快,抢了个首发。一家头部新势力的VLA模型预计2026年才能上车。所以这不是长城独有的秘密,而是整个行业的发展方向。
还有人担心,算力这么大,会不会特别费电?
这个担心有道理。VLA模型对系统实时性和可靠性要求极高,即使经过优化往往只能勉强达到100ms量级的决策延迟。但反过来想,现在手机AI功能那么多,也没见耗电量暴涨。芯片厂商在能效比上也在不断优化,这个问题应该能逐步解决。而且车的电池容量比手机大多了,分摊到智驾系统上的能耗占比其实不算太高。
人问的是,这东西真的安全吗?万一AI判断错了咋办?
这个问题确实是关键。一些系统会增加一个简单快速的安全卫士模块,专门检测碰撞风险,在大模型未及时反应时强制刹车避障。也就是说,VLA再聪明,后面还有一道保险兜底。长城CTO吴会肖说,我们也希望这套系统是第一,但第一不是和大家比排名,而是安全第一,体验第一。这话听着挺实在。
也有人质疑,思维链可视化有啥用?我开车还得盯着屏幕看AI在想啥?
这个理解有点偏差。思维链可视化不是让你实时盯着看,而是在你不放心的时候,能知道AI为啥这么干。影视飓风创始人潘天鸿Tim说,人对于未知的恐惧感是大的,全新蓝山智能进阶版的VLA将整个过程呈现给驾乘人员,会让人对辅助驾驶的信任感极大提升。就像坐飞机,虽然你不懂驾驶舱在干啥,但知道有飞行员在控制,心里就踏实。
还有个现实问题,VLA这么贵,后期维护成本会不会很高?
目前官方没公布数据,但从魏牌在全国130多座城市布局超500个服务触点来看,售后体系还是比较完善的。而且随着技术普及,成本肯定会逐步下降。第一批吃螃蟹的人可能会贵点,但等到技术成熟、规模上来,价格自然就下去了。
有意思的是,还有人问,VLA能不能学我的驾驶习惯?
这个功能目前没看到官方提及,但从技术原理看确实有可能实现。VLA既然能学习人类驾驶行为,理论上也能学你个人的风格。不过这涉及到个性化训练,可能需要时间的数据积累。说不定以后每辆车都能训练出独属于车主的AI副驾。
还有人担心,万一VLA被黑客攻击了咋办?
多模态融合带来的新攻击面确实是隐忧,比如恶意的道路涂鸦或者错误的语音指令可能误导VLA模型做出危险行为。这个问题确实存在,但所有联网设备都面临这个风险,看厂商的安全防护做得如何。长城作为大厂,在信息安全方面应该有相应的防护措施。不过这个领域确实需要持续关注,毕竟安全无小事。
VLA会是智驾的终极形态吗?
长城这次在魏牌蓝山上首搭VLA,看起来是个挺大胆的尝试,但细想想又挺合理。20万价位段的家用SUV,是智驾技术该普及的市场。那些动辄四五十万的豪车,用户本来就不差钱,上点黑科技也。但能把高阶智驾下放到20万级车型,这才是真正惠及普通消费者。
从技术角度看,VLA确实代表了智驾的发展方向。它不是简单的功能堆砌,而是从底层逻辑上改变了车和人的关系。以前是人告诉车该怎么开,现在是车能理解人的意图,甚至能预判危险。这种转变,某种程度上比单纯提升性能参数有意义。
但话说回来,VLA也不是万能的。
它还处在发展初期,肯定会有各种问题。比如算力不够、边缘场景处理不好、系统偶尔卡顿等等。这些都是新技术必然经历的阵痛期。看厂商能不能快速迭代,把问题一个个解决掉。长城敢拿蓝山当小白鼠,说明对自己的技术还是有信心的。
从长城的态度看,他们确实是把VLA当成长期战略来做的。不搞花里胡哨的噱头,不追求表面的参数领先,而是踏踏实实从安全和体验入手。这种务实的路线,或许比那些激进的技术炫技靠谱。毕竟智驾不是实验室里的玩具,而是关乎人命的真家伙。
想说的是,智驾技术的进步,从来不是某一家企业的独角戏。长城搞VLA,理想搞端到端+VLM,小鹏搞自己的方案,大家各显神通,受益的是消费者。技术路线没有绝对的对错,只有适合不适合。就像手机系统,iOS和安卓各有千秋,用户根据自己需求选择就好。
魏牌蓝山搭载VLA,给20万价位段的智驾市场带来了新选项。它能不能成功,还得看用户买不买账。不过有一点可以肯定,让智驾学会害怕这个思路,确实挺新颖。毕竟,会害怕的AI,才是真正把安全放在第一位的AI。这或许就是VLA大的价值所在,不是追求多快多强,而是让智驾变得像人,值得信赖。至于能不能真正实现未卜先知,那就交给时间来检验吧。
全部评论 (0)