文章

纯视觉阵营号角吹响 极具争议的特斯拉 FSD Beta 解析
富士山发电机 2个月前

在上周,特斯拉正式向部分用户推送经过完全重写的 FSD Beta 版本,目前该版本仅在美国地区推送。经过重写的 FSD 可以实现 3D 建模,与过去的 2D 识别有极大的提升。通过车身周围的摄像头以及加入的神经网络算法,FSD Beta 比以往的 FSD 更加强大。

在 FSD Beta 推送后部分国外网友在更新后,立马上路测试。马斯克宣称 FSD Beta 版本将能够实现在无网络连接、无该地区地图数据、无高精地图,就能实现自动驾驶。我们以此为参考看看目前 FSD Beta 都具备何种能力。

什么是 FSD Beta ?

根据版本说明来看,FSD 功能目前仅提供给早期测试用户测试,使用时需要集中注意力,并保持双手在方向盘上,随时接管车辆。目前 FSD Beta 只能在城市道路中使用,以后的正式命名或为 City Steer 城市自动转向功能。

早鸟用户收到通知

在开启 FSD 功能后,车辆可以实现自动变道上下高速,并自动选择导航上的匝道下高速。同时,还可以主动避让路上的人和车以及障碍物。车辆能够自主向右向左转向,在经过路口时需要驾驶员格外留意。

FSD Beta 目前具备的能力

目前特斯拉官方并没有官方声明过 FSD Beta 所具备的功能范围,因此我们仅能从国外视频中的操作来判断它具备的能力。这次 FSD Beta 大家主要聚焦在他在城市街道自动转向的表现。其中包括了

  • 交通灯识别
  • 停车标志识别
  • 十字路口转弯等待
  • 可以自动通过环岛
  • 召唤的时候主动避让车辆和障碍物
  • 主动避让行人(跨实线)

 

1. 交通灯识别

在 FSD Beta 发布之前,这个功能在美国地区已经可以使用。通过摄像头,特斯拉的系统能够识别当前红绿灯的信号状态,并根据当前状态决定车辆的行进。

视频上传成功

2. 停止标志识别

在许多测试者的视频中,都有碰到停车标志识别的情况。在美国 STOP Sign 的标志作用不亚于红绿灯,在看到标志后需要停车 3 秒钟观察,并保证行驶过程中不会与其他车辆碰撞,以免发生意外。

视频上传成功

同时在夜间的识别效果,也不错。

视频上传成功

3. 十字路口转弯等待

在经过十字路口右转的时候,可以看到在车辆的识别系统中,能判断到左向来车,车辆在判断左侧以及对向安全后,才进行右转操作。并沿着车道线行驶。

视频上传成功

 

4. 自动通过环岛

环岛通过的操作确实让不少人吃惊,毕竟现在很多配备辅助驾驶的车辆都无法很好的完成环岛的操作。

视频上传成功

同时,还能根据导航决定驶出的出口。在离开环岛的时候也会判断是否有来车,并在安全的情况下进行操作。

视频上传成功

而在夜间的时候,这个视频展示了特斯拉毫不犹豫的环岛识别能力,操作还是满惊悚的。

5. 召唤时 自动避让车辆与障碍物

在视频中,车辆在停车场受到车主的召唤后,根据周遭的车辆判断行车轨迹。在出停车场时,会判定左右来车,并扫描行车轨迹上的障碍物进行躲避。

视频上传成功

相比以前的召唤功能来说,更加具备可用性。

6. 主动避让行人

在发布的多个视频中,有一个视频让我非常吃惊。开启了 FSD Beta 的车辆在行经一段较为狭窄的道路,道路右侧有一个正在骑自行车的人,车辆在识别后非常顺滑的跨实线进行避让,并与识别到的物体保持一定的安全距离,防止鬼探头。

视频上传成功

在之前的 AP 版本中,特斯拉对于这种情况的避让并不会百分百的准确,尤其是静止的物体很容易出现无法避让的情况。

视频上传成功

而在这个视频中,特斯拉对于鬼探头以及行人横穿这种情况,反应也很及时。

FSD Beta 背后都运用了哪些技术?

众所周知,马斯克一直吹嘘视觉分析技术才是 FSD 的未来,任何依靠激光雷达的辅助驾驶都是垃圾。在这次的 FSD Beta 中出现了不少质疑之声,比如城市自动驾驶是否运用了高精地图以及让用户用生命去为特斯拉提供测试是否符合政府规定。

1. FSD Beta 的 4D  Labeling 技术

首先,特斯拉这次针对 FSD 的重写最主要的就是从 2.5D 识别到 4D 识别,也就是利用单目摄像头做到了景深识别。4D 是马斯克在投资者日上提到的维度,分别是x,y,z 三个维度加上时间维度。

在最新的 FSD 硬件中,特斯拉通过车身周围的 8 个摄像头构成一张影像,并结合车身雷达获得的信息用作综合分析,而不是以往的每个摄像头独立工作独立分析。这是一个非常大的提高与改进。

2. 基于后端 Dojo 强大算力的支持

在去年的 Autonomy Day 上,马斯克曾表示他们内部拥有一个代号为 Dojo 的超级计算机项目。通过输入大量从特斯拉车辆上传的大量视频数据,并且进行无监督的大量算法练习。并且通过自动化工具,对这些视频进行筛选、清洗、标注,从而让算法能力得到提升。同时,内部还有几百名熟练的标记工程师,为这些数据做标记,双管齐下。

可以说,Dojo 是特斯拉推出 HW4.0 芯片后又一大杀器。根据此前马斯克的描述来看,Dojo 能够以 FP32 的速度超过1 Exaflops进行计算。FP32 是浮点数,会比使用 16 位的 FP16 更加精准。而 Exaflop 指的是计算机每秒可以处理多少浮点运算,而 1 Exaflop意味着每秒百亿亿次,与之对比的是目前世界上功能最强大的超级计算机能够以 0.415 Exaflop 的速度运行。

3.  是否运用了高精地图?

而关于高精地图的运用,国外著名特斯拉黑客(@Green)也对此进行了分析,认为特斯拉是利用车辆上传的数据自行绘制了城市 3D 地图,以此来为其他用户的导航做参考。地图数据采用了预加载,即便不是高精度地图,也足以让系统进行提前预判。

毕竟更新后的 FSD 每天上传的数据多达好几个 G ,这些数据最终都会被特斯拉用于分析。目前也有说法表示,这些都是由车辆的神经网络预测路面拓扑结构,因为在一些视频中道路的界限,一直在变化,表示车辆一直在进行预测的修正。

总结

从这次的小范围内测来看,FSD Beta 或者叫他 FSD 2.0 相比目前的 FSD 有了极大的提升。4D 多维度的分析,让车辆具备了空间与时间的感知能力。背靠特斯拉海量车主数据的支撑,以及未来 Dojo 超级计算机的加持,特斯拉在视觉这条路上一条路走到黑,并且在可见的将来也是处于领先地位。

但是,在我看来这次让用户在公开道路上进行测试的行为,其实欠妥。毕竟不是每一位测试用户都是专业的测试员,如果出了意外影响会很大。

无可否认,特斯拉目前在视觉算法这块处于遥遥领先的地位。他的实现方式也与目前其他的大厂有所不同,在质疑声下进行了长达多年的算法更迭,也终于在今年展示其研究成果,并让世人惊叹。由此与其他人拉开的差距,怕是一时半会都无法被追上了。

特斯拉Model 3 特斯拉 特斯拉Model X 特斯拉Model S 特斯拉Model 3(进口)

相关评论共 11 条相关评论

  • 最热
  • 最新
  • 最早

听说是全部重写的

富士山发电机: 对,相当牛逼看起来

水水兄 回复 富士山发电机: 不愧是特斯拉

饶庆辉: 之前的不重新写也已经不行了,所以就顺势的了

水水兄 回复 饶庆辉: 不破不立,哈哈,就像蔚来李斌要重新自研芯片一样

饶庆辉 回复 水水兄: 李斌做芯片这个其实还只是一个很早期的想法,就拉人开了2次会而已,就被人爆出来了,李斌自己都有点恼火。

这实力秒杀全球实力唯二的

富士山发电机: 领先了

XCX6818WZalv: 感觉一直在跟随,架构与技术路线上有差距

希望能写一写激光雷达与视觉阵营的PK,激光雷达大疆的方案也要1万元,更不用说百度车顶那70万的激光雷达。。。

富士山发电机: 这个目前没法很好的 PK ,因为没有完全实力均衡的对手