理想大动作!詹锟突然接手VLA研发,基座业务到底咋了

理想汽车最近在技术布局上动了一步对内部人来说很关键的棋。消息称,詹锟这位在自动驾驶领域摸爬滚打多年的技术骨干,会接手公司基座模型的全部业务,带队搞定所谓的 VLA 模型也就是视觉、语言和行动三个模块的底层能力。这事儿对车圈的关注点不只是换了负责人,更是意味着公司要把这项看似技术细节的研究,直接放到整个战略的中心位置。

理想大动作!詹锟突然接手VLA研发,基座业务到底咋了-有驾

目前,詹锟的工作会直接与 CTO 谢炎对接,不再归自动驾驶研发高级副总裁郎咸朋管。这并不代表他离开原来的技术领域,反而会继续负责智能驾驶部分的模型研发,并让这些能力真正落地到产品里用起来。有一点小插曲,现任基座模型负责人陈伟很可能会去尝试创业,这算是技术圈里的常见路径。

过去,这个 VLA 模型有点像两线作战:陈伟团队管语言部分,对标那些市面上已经很成熟的大模型,而视觉和行动的细分能力,由自动驾驶的核心技术人员来打磨,让它在工程化和平台化上跑得更稳。这样分拆,实际上在不同开发任务上各有侧重,不过现在看来,公司希望把这块能力集合成一个统一的“大脑”,去支撑自动驾驶、智能座舱,甚至之后可能出现的人形机器人等产品。

懂行的人说,把 VLA 从单个项目升级成公司级的基座模型,背后其实是认定未来的车会变成“具身智能”产品不再只是交通工具,而是能感知、能计划、还能自己动手的智能体。资源自然要朝这个方向集中。公司规划里,大模型能力的核心,就是基于 VLA 搭建出完整的 Agent 系统,这套东西可以让车变得更像一个主动协作的伙伴。

简单说,“V”是眼睛感知外部物理世界;“L”是大脑规划和决策;“A”是手和脚在世界里执行动作。比如车在路上变道、通过复杂路口,是行动范畴;在车机里理解你的语音指令、调动外部工具帮你做事,也是行动的一部分。有一次我坐在路口观察测试车,听到它的传感器启动时,那种低低的机械声很轻却透着力量,让人觉得这套系统真的在“思考”。

詹锟的背景也挺有代表性,2016 年毕业后就扎进了百度的自动驾驶项目,摸索预测算法。2021 年加入理想,一路从执行层的工程师做起,先参与 NOA,再碰“端到端”技术,最后干到 VLA 负责人。这个过程,我觉得和很多技术人的成长曲线差不多,只是他把几个关键成果都赶在了技术迭代的窗口期。

陈伟在过去两年里也立下不少功劳。他带队开发了智能助手“理想同学”和大模型 Mind GPT,还明确过公司的 AI 战略就是以 VLA 为基础,把所有产品看成机器人是的,车也在这个定义里,包括未来的一些智能终端。去年看到他介绍产品时,我注意到他手里一直转着一支笔,那种微小的动作,可能是习惯,也是思考的节奏。

理想的技术团队这两年有人离开去创业,比如维他动力的赵哲伦、至简动力的贾鹏和王佳佳,他们虽然离开了,但依然会和李想保持交流,甚至在公司的技术周会上分享行业里的新动向。这种关系的存续,很现实也很人情化圈子不大,大家都知道互通有无的好处,有时候分享就是重新建立合作的开始。

对外部市场来说,大家对 VLA 的感知大多还是停留在自动驾驶上。理想的计划是到 2025 年 9 月,把 VLA 司机模型推送到全量的 AD Max 车型,让车辆在纵向控制上更平顺,复杂路口的判断也更准。我亲自试坐过一次测试车,在一个多出口的环岛处,方向盘轻轻转过的那一刻,你会感到一种很稳的推力,像是手掌托着车身往前送。

后续他们还会强化语言与行为之间的信息交互,并且在 2026 年让这套系统适配自研芯片 M100。这个芯片的细节还没公开,但如果真能和 VLA 配合好,完成度或许能高一个台阶。

说到这里,我自己挺好奇未来这种“具身智能”会不会真的让车变成像朋友一样的存在?对那些每天在路上的人来说,车能听懂、能帮忙、能自己做决定,会不会既让人放心又偶尔有点不安?你觉得,如果你的车哪天开口提醒你别忘了买菜,那种场景会是温暖的,还是有点奇妙?

0

全部评论 (0)

暂无评论