字节的豆包大模型悄悄钻进了特斯拉的车里。
火山引擎FORCE大会上,字节公布了这件事:特斯拉中国区正式把豆包内置进车机。官网也更新了车机语音助手的使用条款——新款Model Y里同时跑着豆包和DeepSeek两套模型。科技圈和汽车圈一阵热闹。
说白了,马斯克那套“全栈自研、不依赖任何人”的做法,在中国没走通。原因很现实:特斯拉中国的语音系统多年没大改。今年有人实测,2025款Model Y在安静环境下语音识别准确率是92%,高速噪音里降到85%。遇到含蓄的指令就更吃力——“有点冷”这类暗示,它基本听不懂。与此同时,国产车的座舱早就能多轮对话、识别方言、做开放式闲聊,甚至有情绪感知这些功能。
在美国,特斯拉是把自家xAI的Grok塞进车里的。想在中国照搬这套,但监管不允许把境内语音和行驶数据传出国处理。能用的办法只有和国产大模型合作。所以这次合作,并不是浪漫的战略联姻,而是特斯拉在中国市场别无选择。
那为什么是豆包?用数据说话。今年一季度,豆包月活超过3亿,超过第二名和第三名月活之和。换句话说,它在中文用户习惯这件事上占了优势。这也是特斯拉选择它的关键原因之一。
还有个细节:特斯拉和火山引擎从签约到上线,前后花了近12个月。外界以为是商量拖延,真正耗时的,是技术上的结构性问题。这次不是装两个App那么简单。豆包和DeepSeek要分工:豆包负责车辆控制(导航、空调、多媒体,支持0.5秒快速响应,方言识别),DeepSeek负责自由对话(闲聊、情感陪伴、天气资讯)。两套模型同时在线,算力消耗是叠加的,车机的架构得重新设计,否则比以前更卡。
算力成本大到让字节也吃不消。豆包的日均Token使用量,从2024年5月的1200亿,涨到今年3月已突破120万亿,短短两年间涨了1000倍。浙商证券测算,字节2025年资本开支约1500亿元,其中约900亿元用于AI算力采购。账面上的烧钱压力,让把豆包推向汽车这个规模化场景,变得尤为重要。
字节也在走商业化两条路:一边对C端收费,6月24日宣布的价格是标准版68元/月,高级版500元/月,年费最高5088元;另一边则寻求融资,据知情人士透露,字节正与多家银行洽谈,计划筹约200亿美元的境外贷款。
进军汽车界并非临时起意。北京车展上,火山引擎的豆包几乎成为C位,不少主流车企都在与其合作。奔驰、比亚迪、上汽、长安马自达等都陆续签约。加上这次特斯拉,豆包在乘用车赛道的覆盖已经很密集。
这件事真正有意思的,不只是豆包又拿下一个大客户。更大的转折是:汽车座舱正在成为国产大模型第一个能真正赚钱的主战场。每台出厂的车,都是一个长期在线的语音交互终端。用户不需要额外下载,也不需要去考虑要不要付费,打开车门,系统就在那儿。这种渗透,对订阅模式和企业API合同来说,很难复制。
从更广的角度看,这次合作意味着特斯拉“全栈自研”的神话,在国产通用AI面前出现了第一道真实的裂缝。对国内的特斯拉车主来说,真正关心的还是一件事:自家车能不能变得更聪明。