理想 i8 掀起智驾革命! 首发 VLA,郎咸朋放话:对手现在想追,已经来不及了!
昨晚,理想汽车干了一件让行业睡不着觉的大事。 他们憋了五年的大招,全球首发VLA(视觉-语言-行动)模型,就装在新车理想i8身上。 理想自动驾驶老大郎咸朋博士直接放话:对手再想追赶? 抱歉,为时已晚!
i8售价32.18万起,作为理想进军纯电的首款SUV,它在补能和智驾上下了血本。 而VLA,就是它敢叫板市场、定义未来的终极武器。 过去五年,理想在智驾领域一直扮演追赶者角色,被贴着“技术差生”的标签,如今靠VLA,竟上演了一出惊天逆转。
这VLA有多猛? 说出来你可能不信。 它像个“神预测帝”,能结合看到的画面(Vision)、理解的指令(Language),瞬间做出安全合理的驾驶动作(Action)。 理想车主开车,大约60万公里会出一次事故;用了VLA智驾,变成400万公里才出一次。 他们的目标更狠,要干到600万公里出一次事故,比人开车安全整整十倍! 郎咸朋自信表态,这个目标靠VLA就能实现。
安全只是底线,舒服才是大招。 VLA被定位成“完美家庭司机”。 试驾时发现,在窄得吓人的双向道上,右边有辆三轮车挡路。 你想让它向左变道? 不好意思,得压过逆行车道。 以前的智驾敢冒险试试,现在VLA根本不动! 为啥? 郎咸朋团队说了:安全安心排第一,这种危险操作,咱不做。 急刹? 重刹? 坐着晕车? 更是不存在的。 这车开得像开了十年专车的老司机一样丝滑。
有人问,这不就是“端到端大模型”的升级版嘛? 郎咸朋笑了:VLA可不止这点本事。 端到端是基础,上限就在这儿了。 VLA刚起步,未来空间大得多。 他用成绩说话:去年我们搞端到端,MPI(人工接管里程)从10公里干到了100公里,只用一年。 VLA? 明年我们坐这儿再聊,它能给你干到1000公里去! 你就说狠不狠?
友商肯定不服:不就是发个VLA嘛,你能首发,我们也能跟着做啊? 郎咸朋淡定回答:晚了。 真不是瞧不起谁,VLA这东西,不是你想追就能追。 跳过前面的规则算法? 放弃端到端的基础? 门儿都没有!
做VLA没数据等于空谈。 理想汽车的数据墙厚到什么程度? 他们攒了整整12亿条驾驶数据! 从2020年开始,靠理想ONE一辆一辆跑,一年就攒了1500多万条有效信息。 正是这些数据,让他们懂得世界模型该怎么“活”,知道怎么训练模型学习驾驶逻辑。 郎咸朋直指核心:没有这些数据沉淀,别说训练世界模型,你连该造什么样的数据都搞不清!
对手开始急了:那学呗! 搞大规模路测,砸钱收数据呗? 郎咸朋又笑了,笑得有点无奈:你们还在用老一套搞啊? 他给理想整了个“超级外挂”,仿真测试。
理想团队的猛料就在这里。 今年,他们90%的测试是在电脑里完成的,完全模拟真实世界,复刻率超过99.9%! 过去一年他们还实打实跑了150多万公里路测,这不是为了测试功能,而是为了校准这个超级仿真系统有多准! 为啥不用实车测试? 郎咸朋反问:效率低、成本高、场景还难复现。 仿真不仅准,还便宜得不像话,每公里成本只要0.5元,你试试真实路测,18.4元/公里! 靠这个系统,半年时间,他们就完成了4000万公里的测试! 1800倍的效率提升,你怎么追?
最震撼的,还不是测试快慢。 VLA的训练是搞强化学习,得有成熟真实的仿真环境当“陪练”。 同行们搞的是端到端那套老方法,依赖模仿学习。 郎咸朋说,这两者从根上就不一样! 你想按老路抄捷径? 越抄离得越远! 他抛出一句金句:“如果还是沿着端到端思路去做所谓的VLA,你的速度一定会变慢。 ”这个技术代差,成了他信心爆棚的底气:“世界模型仿真的壁垒非常高,别人很难短时间复制出来! ”
VLA模型辣么大、辣么牛,车里的芯片扛得住吗? 理想研发团队还有个隐藏技能:算力压榨大法!
别人还在讨论英伟达Thor芯片强不强时,理想工程师们说:要发挥Thor的真正实力? 得改底层! 理想自动驾驶团队向来以“工程能力极强”著称,他们从拿到Orin芯片做大模型部署那会儿,就在魔改了,连英伟达都说“不可能”。 他们愣是从零起步,重写了PTX底层指令,自己改CUDA,把芯片算力抠到极致。
原本VLA跑一帧需要500-600毫秒,慢得没法用。 最终,他们硬是把它做到了10Hz响应! 10倍提升! 怎么做到的? 答案叫量化精度。 别人搞FP16精度(浮点数精度16位),他们直接砍到FP8! 精度降了会影响效果? 研发专家詹锟解释了:不会。 大模型在发展到一定程度后,其实对数值精度的容忍度变高了,容错能力更强。 加上理想做了海量的数据清洗工作,把脏数据、噪声数据清掉,模型照样稳定输出。 詹锟还透露,FP4也在规划里呢! 做到这一步,Thor的算力等于又翻一倍。 你就说理想团队是不是一群技术老法师?
有人说,这VLA部署起来太费劲了,为啥不搞个精简版? 詹锟也说了:搞了呀! 我们用了模型蒸馏神技。 理想在云端用海量知识训练了个32B的巨型“老师傅”,然后把老师傅的思考逻辑、推理能力,提炼(蒸馏)到3.2B的“学生小模型”上。 这个小模型用了行业首创的8×0.4B MoE架构,既省算力又能装下复杂逻辑。
路径规划环节。 过去Diffusion(一种复杂计算过程)要推演10步,太慢了! 他们用Flow Matching流匹配技术一步压缩成两步搞定。 詹锟打了个比方:VLA理解物理空间的距离感超强,靠的是大量通识数据训练积累的涌现能力。 你跟i8说“往前挪5米”,它就真的精准往前挪5米,这不是硬记住的指令,是它真正理解了空间!
当被问到VLA的价值和地位时,詹锟一语点透:VLA不只是智驾的革命。 它其实是“具身智能”落地物理世界的核心技术框架。 具身智能啥意思? 就是给机器一个身体,像人一样在物理世界感知、思考和行动。 这个突破不只让i8更像一位“体贴入微的家庭司机”,更是未来所有物理AI的基石。 机器人、智慧空间,都可能靠着VLA技术框架起飞! 郎咸朋也补充,理想其实也在机器人方向上发力。 短期,他们还不想搞得太花哨:“先把车开好最重要”。
最让对手背后发凉的一幕出现了。 当问起竞争对手也搞VLA会怎么样? 郎咸朋直接甩出两个结论:第一,对手去年才真正把理想当回事,“他们为时已晚”。 第二,“技术壁垒肯定有”,短期内无法超越。 他底气十足:“他们现在还停留在嘴上说,或者在用端到端方式去做所谓VLA。 ”
为啥他这么有把握? 理想的200人精干团队,是以项目制研发模式快速突击的。 从去年的端到端(180人),到今年的VLA(200多人),干出来的效率远超几千人大团队。 他们不迷恋堆人,追求的是像特斯拉那样的精品小团队攻坚。
理想i8这次首发VLA,其实不只是推出一款新车。 郎咸朋一句话给整个智驾战场定了调子:“对手追赶已经晚了! ”这个当年被称为“技术差生”的品牌,这一次站在了规则的制定者位置上。 所有关于智能驾驶的话语权争夺,从昨天那一刻起,格局彻底变了。
全部评论 (0)