{{detailStore.author.is_follow?'已关注':'关注'}}
原创话题文章
管理
新出行深度 | 智能辅助驾驶从「军备竞赛」到「体验至上」的转变
新出行原创 · 话题文章

当技术发展遇到“瓶颈”,我们目标又该如何转变

“如果没有实现,我们智能驾驶负责人刘先明同学承诺在金门大桥裸跑”,何小鹏在美国体验完特斯拉 FSD V14.2 版本后在社交媒体打趣的说到。

这条帖子比较长,何小鹏主要是提到了接下来小鹏将在下个季度发布的 VLA2.0 ,并且要在明年 8 月底达到目前特斯拉 FSD V14.2 在美国的表现能力。

而在月初的地平线生态大会上,地平线副总裁苏箐也表示,只有完全一段式端到端才能带给我们最拟人的驾驶体验,这就是端到端意义所在,但这件事非常难。虽说特斯拉从 FSD V12 让大家看到了希望,但目前智能驾驶技术的发展确实进入了瓶颈期,未来数十年或许都是基于现在的成果做优化,而不是内核的重构。

这两位大佬的发言,都有相同的细节。一个是对于特斯拉 FSD 的肯定;另一个则是都抛弃了传统的智驾硬件与能力范畴,反而专注于智驾技术所带来的“体验”。

为什么现在的智驾行业会发生这样的转变,让我们细细道来。

「堆硬件」的时代已经过去

- 硬件成本过高

从早些年的“算力比拼”、“传感器数量竞赛” 到现在的 “拟人化体验”、“全场景可用度”,近年来智驾风口的转变并不是单纯的车企转移了营销噱头,而是在 “同质化困局”、“技术瓶颈”、“用户体验” 三重压力下的转变。

在智能驾驶的发展中,曾经不论是车企还是用户,都认为传感器数量越多、算力越高的车型智驾能力越强。于是我们看到了激光雷达数量越来越多,芯片算力从 100TOPS 跨越到 1000TOPS。

在这种近乎疯狂的军备竞赛下,车辆智驾的硬件成本巅峰时期一度要占据整车成本的 15%,并且这一成本压力最终都转嫁给了普通用户。

- 算力冗余过于超前

前些年大家听到最多的关键词,估计就是算力冗余和硬件冗余,美其名曰超前的配置可以承接后续的算法进步。

但现在来看,大家对于算力和硬件的利用度并没有那么高,例如据相关机构表明,目前行业整体的智驾算力利用率大概在 35-45%。并且高算力芯片的能耗也是偏高的,会形成一个“算力越高,能耗也越高”的闭环。

由于算法的进步速度不及预期,高算力也难以转化为实际性能,所以在算法能力差异不大的前提下,高算力所带来的细微优势也很难被用户感知到。

就像部分车企通过神经网络的结构优化,可以在算力水平低于“行业顶流”的情况下,响应速度与执行动作更加优秀。所以说脱离了算法的硬件堆砌,本质上是资源的浪费与成本的提高。

功能已经「同质化」

智驾行业经历多年的发展,从最早的 LCC 到现在的无图 NOA ,大家现在看各家在智驾上的功能点,在激烈竞争下其实已经偏向了我们所说的「同质化」。

在智驾竞赛时代,智驾功能是车企提升车型溢价的工具,例如我有高速 NOA 能力,但竞品车型还停留在 LCC ,那么我就有信心通过这个功能拉高产品溢价,用户也乐于为此买单。

这个现象一直存在,赛道上的竞争也从未停止,只不过内卷的功能一直在进化。从 LCC 到 高速 NOA 再到 城市 NOA ,以至于 车位到车位 这种都是功能上竞赛,谁能先做出来谁就拿到了先吃蛋糕的权利,至于体验如何都是后话,留下一句“持续 OTA 即可”。

“但是大人,时代变了”,前面的我们也说道,智驾的核心还是算法,而算法发展的放缓不止影响了硬件冗余,还有就是功能上的迭代。

现在我们仔细观察,核心的智驾功能已经是“你有我有大家有”的局面,功能上的同质化时代已经到来。

那么在如今的瓶颈之下,未来的智驾行业,该走向何处。

智驾重心的「转变」

现如今我们能发现,智驾发展的中心已经从单纯的硬件堆砌、功能加码转变为体验优先。

在摆脱了「军备竞赛」后,用户对智驾的不满,很大程度上已经不再是硬件或者能力“低人一等”,而是 “场景割裂”,例如车辆系统高速表现稳定,但城区道路频繁接管;晴天好用,雨天失效。

从近两年我们能看到,各家都在注重如何能将系统表现做得更加拟人化。 智驾体验的本质是 “人机协同”,而非 “机器主导”,只有让用户感受到 “系统懂我、可控”,才能建立真正的人与车之间信任。 

在今年,我们也见证了 VLA 与世界模型的并行发展,VLA 解决系统“不会说话”的人机交互问题,而世界模型则赋予了系统“脑补”的能力,像人一样接收到环境信息后预测接下来会发生什么。

前段时间的 L3 级自动驾驶车型准入试点,也是体验上的进步,其算法与硬件并没有质的飞跃,但通过“脱手+免注视”的体验升级,为行业的下一步发展提供了一个长期目标。

端到端是瓶颈也是目标

开头我们也提到,在地平线生态大会上苏箐发言说:“ 只有完全一段式的革命,才能真正做到类人的体验,这就是端到端意义所在,但这件事非常难。 ”

- 为什么一段式端到端是突破瓶颈的“圣杯”

在端到端还未到来之前,传统架构的智驾系统就像是“工厂的流水线”,环环相扣且容错率极低,如果第一步数据就不对那么后面的步骤就会逐步累积,最终执行时就会发生严重的错误。例如系统第一步数据库中没有的障碍物误判成阴影,后面的行车规划与执行动作就会全部错误,最终导致事故。

一段式端到端则是尽可能的学习了人类做动作的方式,眼睛看到-大脑处理-身体做出动作,例如人类驾驶员在遇到障碍物时,本能的反应就是需要刹车或者躲避,不会先去尝试理解这个障碍物是人还是柱子。

此外,传统架构的系统,需要工程师尽可能把我们在路上所遇到的情况写入系统中去,但这样不可能面面俱到,总会有意想不到的情况出现在车辆行驶过程中,这也是为什么传统架构系统在高速会更加稳定一些,因为高速上的交通状况并没有城市中那么“多样化”。

一段式端到端通过深度学习神经网络,让模型自己学会 “该干什么”。它不需要工程师告诉它 “那是什么障碍物”,它只需要知道 “妈妈跟我说过,我看到的画面有这种像素分布,踩刹车就是正确的”。

所以特斯拉从 FSD V12 开始,通过一段式端到端,砍掉了 V11 传统架构的 30 万行感知与规划代码,并且系统处理能力也得到了较大的提升。

并且其在 V14 版本也实现了近似 L3 的能力(可脱手+免注视),这也是为什么开头何小鹏表示要在明年追上特斯拉 V14 版本的能力。

- 为什么完全一段式又很困难

既是目标也是瓶颈,一段式端到端虽说相较于传统分段式架构更加“聪明”,但这就好像一个好学生和笨学生。

传统分段式架构就是笨学生,考试时答题喜欢一步步做,答案不对老师也能知道他哪一步做错了。这就是传统分段式的优点,那就是错误的可追溯性,有错就能改掉。

而一段式端到端的深度学习神经网络虽然让它变成了好学生,但它答题更倾向于直接写答案,虽然大部分时间答题又快又正确,但只要出现一次答案错误,老师也不知道它哪一步做错了。这就是一段式最大的缺点-错误不可解释、不可回溯,它只知道根据题目应该这样写答案,但并不知道过程哪里错了。

一段式的“终局之战”

端到端需要老师不断的教导才能变成一个好学生,但如果老师教的不好,他也会把老师的缺点都学过去。也就是说如果你的车在智驾过程中出现了违反交规等危险动作,那么他就是在海量的数据训练中学到了一些“不好的驾驶习惯”。

并且在遇到一些从未训练过的场景时(多数为极端场景),如何保证让其给出正确的执行动作也是困难之一。如果因为老师没教过这道题就乱写答案,那肯定是不行的。

所以对于一段式的云端训练,消耗的也是天文数字的算力,例如特斯拉 Dojo、小鹏扶摇超算等等。

总的来说就是一段式端到端试图通过模仿人类大脑的直觉反应,来解决传统逻辑代码无法全部解决的复杂路况,但如今在法规与安全性上还需要持续攻坚突破。

这也是为什么苏箐说:“未来几年,整个 AD 可能还是基于现在的系统不断做优化,而不是内核的重构。”

如今的军备竞赛降温正是最好的表现,大家从大步迈进变成了小步快跑,相信智驾行业在重回“体验至上”的本质之后,我们能够得到更好的体验。

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{feature?'撤销':'进'}}精选库
  • {{digest?'撤销精华':'设为精华'}}
回到顶部
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}