刚刚确认字节跳动与特斯拉已达成协议-有驾

字节的豆包大模型悄悄钻进了特斯拉的车里。

火山引擎FORCE大会上，字节公布了这件事：特斯拉中国区正式把豆包内置进车机。官网也更新了车机语音助手的使用条款——新款Model Y里同时跑着豆包和DeepSeek两套模型。科技圈和汽车圈一阵热闹。

说白了，马斯克那套“全栈自研、不依赖任何人”的做法，在中国没走通。原因很现实：特斯拉中国的语音系统多年没大改。今年有人实测，2025款Model Y在安静环境下语音识别准确率是92%，高速噪音里降到85%。遇到含蓄的指令就更吃力——“有点冷”这类暗示，它基本听不懂。与此同时，国产车的座舱早就能多轮对话、识别方言、做开放式闲聊，甚至有情绪感知这些功能。

在美国，特斯拉是把自家xAI的Grok塞进车里的。想在中国照搬这套，但监管不允许把境内语音和行驶数据传出国处理。能用的办法只有和国产大模型合作。所以这次合作，并不是浪漫的战略联姻，而是特斯拉在中国市场别无选择。

那为什么是豆包？用数据说话。今年一季度，豆包月活超过3亿，超过第二名和第三名月活之和。换句话说，它在中文用户习惯这件事上占了优势。这也是特斯拉选择它的关键原因之一。

还有个细节：特斯拉和火山引擎从签约到上线，前后花了近12个月。外界以为是商量拖延，真正耗时的，是技术上的结构性问题。这次不是装两个App那么简单。豆包和DeepSeek要分工：豆包负责车辆控制（导航、空调、多媒体，支持0.5秒快速响应，方言识别），DeepSeek负责自由对话（闲聊、情感陪伴、天气资讯）。两套模型同时在线，算力消耗是叠加的，车机的架构得重新设计，否则比以前更卡。

算力成本大到让字节也吃不消。豆包的日均Token使用量，从2024年5月的1200亿，涨到今年3月已突破120万亿，短短两年间涨了1000倍。浙商证券测算，字节2025年资本开支约1500亿元，其中约900亿元用于AI算力采购。账面上的烧钱压力，让把豆包推向汽车这个规模化场景，变得尤为重要。

字节也在走商业化两条路：一边对C端收费，6月24日宣布的价格是标准版68元/月，高级版500元/月，年费最高5088元；另一边则寻求融资，据知情人士透露，字节正与多家银行洽谈，计划筹约200亿美元的境外贷款。

进军汽车界并非临时起意。北京车展上，火山引擎的豆包几乎成为C位，不少主流车企都在与其合作。奔驰、比亚迪、上汽、长安马自达等都陆续签约。加上这次特斯拉，豆包在乘用车赛道的覆盖已经很密集。

这件事真正有意思的，不只是豆包又拿下一个大客户。更大的转折是：汽车座舱正在成为国产大模型第一个能真正赚钱的主战场。每台出厂的车，都是一个长期在线的语音交互终端。用户不需要额外下载，也不需要去考虑要不要付费，打开车门，系统就在那儿。这种渗透，对订阅模式和企业API合同来说，很难复制。

从更广的角度看，这次合作意味着特斯拉“全栈自研”的神话，在国产通用AI面前出现了第一道真实的裂缝。对国内的特斯拉车主来说，真正关心的还是一件事：自家车能不能变得更聪明。