
在春节放假的那会,我刷着手机,突然有一条热搜窜到了 TOP1:DeepSeek 一夜掀翻美股。

我当时还纳闷,DeepSeek 是什么东西?怎么一下子就火?搜了一下,着实不简单。
用大白话来说就是,一个国产 AI 大模型正在颠覆全球的 AI 行业,仅用数百万成本就能达到与 OpenAI 几亿美元投入相匹的效果,这谁能受得了?

而在这几日,我还在喷着 DeepSeek “服务器繁忙,请稍后再试”的时候,国内车企就像排长龙一样,前赴后继的宣布接入 DeepSeek,什么岚图、极氪、智己、宝骏、比亚迪......
但我看到这条消息的时候,我不经会想:DeepSeek 上车的意义是什么?什么叫做深度融合?车载版与原生 DeepSeek 又有何区别?
当然,最重要的灵魂拷问还是:这到底是一个营销噱头,蹭 DeepSeek 热度?还是真能提高用车体验?
DeepSeek 是噱头还是提升?
面对这个问题,让我上 DeepSeek 问问是啷个情况。
话说回来,「大模型」上车其实并不是什么新鲜词了,早在前两年,许多车企就已经将 AI 大模型融入到自身的座舱、语音系统上了。后来演变的智驾「端到端」也是「大模型」上车的具体案例。
只不过车企所宣传的「大模型」大多都是以自研为主,因此不同的模型之间会存在性能上的差异,所反映到产品上就是体验的参差不齐。

那么在自家原本就有大模型的基础上,还要将 DeepSeek 接入上车,到底有何用意?又是以什么样的形式放到车上的呢?
我狠狠研究了一番(DeepSeek 启动),发现各家车企在宣发的海报或者是新闻稿上有着这几个关键词:集成、本地布置、蒸馏训练。
那么经过查询研究,基本可以确定,目前 DeepSeek 的上车方式大概率会是这以下三种:
第一种就是最轻松的方式,服务商发力,我坐享其成。就例如头部的云端大模型服务商:思必驰,前段时间就官宣了自己在云端模型里融合了 DeepSeek 模型。而使用该服务商方案的车企们也就变向拥有了 DeepSeek 的加持。


第二种就是车企自己通过 DeepSeek 的 MIT 开源协议,在自有服务器上部署其开源的 R1 模型(满血版或蒸馏版),并通过微调与自有模型融合为统一的大模型或者是统合进一个“AI 平台”,车主端则可通过 OTA 或边缘计算实时调用模型能力。

第三种就是通过蒸馏的方式,把 R1 模型压缩成一个体积非常小的小模型然后 OTA 到车端,以此让车主端就算不联网,也能获得 DeepSeek 的部分功能。
说到底,这些方式的核心都是在自有模型上进行融合或者说是集成,简单来说就是在原有的大模型上加了一层 DeepSeek 的“Buff”,以此能够拥有 R1 模型部分的能力。
那上了 DeepSeek 对于车端来说能获得什么样的提升呢?又用在哪里呢?
目前根据大部分车企所宣传的海报来看,它们均把 DeepSeek 赋能在了智能座舱和语音助手上。

结合 DeepSeek 的超强推理能力来说,好像似乎就只能让语音助手变得更加聪明,更加听得懂人话。又或是能够回答一些抽象、复杂,以及“弱智”的问题,来考考语音助手......
嘶......这好像没有并没有太大的提升。

的确,因为这类似的功能其实早在一些车型上实现了,比如理想的 MindGPT、蔚来的 NomiGTP、 小鹏的 X-GPT 大模型等等,面对一些抽象、复杂的提问都给出较为合理的回答。

但我深刻思考了一下(花费 3 秒),问题来了,好像从实际用车场景出发,我们压根不会问车机太过复杂的问题,顶多就是放放歌、调调空调、打开个座椅按摩这些。
而这些功能就算不是 DeepSeek 这种级别的大模型,其实也都能解决的七七八八,只要你不是“好奇小子”,开车开到一半问语音助手:佛祖和耶稣打起来,哪个会赢......

所以,在我个人看来,DeepSeek 上车热潮肯定是噱头大于实际效果,在短时间内还是难以实现「量变到质变」。
不过,如果某些车企原本在座舱上就有短板,或者说是自有的大模型性能还不够好的,利用 DeepSeek 进行补强,让自家的座舱系统以及语音助手追上一线梯队的水平,也是一件利好的事。
DeepSeek 能为智驾做些什么?
吼,这是个好问题。
其实在我看来,把 DeepSeek 放到智驾层面,可能才是挖掘出它更大潜力的地方。

要知道,DeepSeek 之所以产生了这么大的轰动,开源是一方面,主要的核心其实是以低成本、高效率的模式重构了 AI 行业的底层逻辑。

非常 big 胆的使用了纯强化学习的方式,摒弃了传统大模型赖于监督微调(SFT)以及人工标注数据的训练模式。简单来说,就是利用机制让 AI 自己领悟推导过程。
这种方法不仅大幅降低了训练成本,还显著提升了模型的推理能力。

理想汽车的 CEO 李想就曾提过,人类大脑中存在两套思考系统:“系统 1”和“系统 2”。其中系统 1 负责以低能耗的方式处理直觉类工作,而系统 2 则负责在复杂情况中进行推理,处理各种 Corner Case。
而自动驾驶领域的最终目的也就是模拟人类的思考和决策过程。
那么以推理见长的 DeepSeek R1 模型,从原理来说是能够帮助智驾系统提升“系统 2”的能力的。例如,在复杂路口动态调整路径规划上,或在突发状况中,能够快速优化车端的推理速度,从而做出更好的驾驶判断。

智驾开发的另一个难度,体现在数据采集侧。传统的数据采集方式往往局限于车辆自身的传感器,而 DeepSeek 可以通过整合车端、路端和云端的多源数据,构建了一个多维度的数据生态,提升智驾模型的数据质量和训练效率。
其次在 DeepSeek 模型当中,也引入了 MoE (混合专家架构) 、MLA (多头潜在注意力机制) 等技术,这些技术也能够通过类似“蒸馏”的方式,从海量数据中提取有价值的信息,并自动识别和标注,降低数据挖掘和人工标注的成本。

回看 2024 年,智驾“端到端”的时代,想要做好智驾,那就得囤算力、囤数据,不断训练、不断迭代。伴随着智驾参数量的持续扩大,那就要持续为算力集群投入资金,花钱砸算力。
而如今 DeepSeek 出现,似乎提供到了一个好用又不贵的新解决思路。
当然了,理论终究是理论,想要在智驾训练里大规模的用上 DeepSeek R1 模型或者是说强化学习技术 ,依旧有不少难点和瓶颈。
就比如,强化学习的试错过程需要巨大的算力支撑,这对于不是专注于 AI 行业的车企来说,还不一定能搞得定。
其次就是幻觉率的问题,简单来说就是在生成信息时会出现不准确或是“胡说八道”的情况。这也是 DeepSeek R1 模型创造力爆棚所带来的副作用。

所以,在智驾这种严谨性高、安全系数高的场景中,还是需要有监督的方案来确保下限,否则就是对行车安全的不负责。
当一个又一个大模型在各行各业落地应用,大模型落地似乎并没有我们想象中的那么难。但难的是,落地后如何去正确的使用。
作者结语 ... /
DeepSeek 的横空出世,打破了 AI 行业的底层逻辑,为智能汽车领域带来了新的思考以及活力。
虽然 DeepSeek 在智驾领域的相关应用上还存在一定难点以及瓶颈,但其在成本和技术上的突破,也为智驾带来了直接的技术借鉴和启示。
或许 DeepSeek 的出现,能够进一步加快高阶智驾的到来,以及更广泛的智驾平权。