{{detailStore.author.is_follow?'已关注':'关注'}}
管理
智驾黑话,是时候要讲点武德了
文章

#一段式端到端# ,世界模型,VLA,VLM,如今智能驾驶圈子#听不懂的汽车黑话#是越来越多了,粗略来看功能,又只能笼统的概括成全国都能开。那体验是不是真的没有高下之分了呢?我觉得也还是可以从体验和技术上聊聊。

从体验上来说,不同的全国都能开,能力边界差别还是很大的。从主要道路都能开到调头,待转区,ETC抬杆能搞定,需要有更完善的感知和控制能力。再到高速,城区,泊车一体化,需要具备完善的道路拓扑结构实时理解能力,看的更远,对距离的把控更精准。更进一步,面对交警手势,甚至是像FSD V14提现出的drive through 取餐场景,就更需要进一步融合对世界各种场景的语义化理解能力。

而更困难的,是面对多重相互冲突的逻辑,如何取舍和判断,比如右转车道施工占用,有施工人员手势引导,需要从直行道右转等等,车辆需要统一理解过去几秒甚至几十秒的场景,并对接下来自己的行为做出多种预测和取舍。而这一切,需要在很短的时间决策,同时考虑所有情况,才可以展现出类似老司机的丝滑而稳定的决策,像之前和@大包子狸 一起体验的HSD工程版,在徐汇体育馆如此狭窄拥堵的地段穿行了几个小时,几乎没有突兀刹停,最后困的我睡着了,它说是一段式端到端,我觉得可以信

这其实和人类司机的进阶很像,新手司机往往经验不足,只能考虑很短距离内跟车的情况,而忽视侧边来车,原处施工等场景,往往危险到眼前,才会下意识的干预,急刹车,危险自然接踵而至。

而老司机盯着导航的前方拥堵,看着临时改道,预判着闯红灯在盲区的行人,就会做出更多预防性驾驶,看似波澜不惊,实际上早就将各种危险反复权衡考虑。

而这种转变,正是一段式端到端和世界模型,VLA技术的价值。将感知决策执行融为一体的一段式端到端,让系统真正具备了感知信息直接转换为动作的能力,叠加上世界模型大量的,长尾的,完整的数据输入,让车辆具备了更完整统一的决策输出能力,同时像VLA技术,可以让这个强大,但是有些黑盒的模型,辅助输出更多人类可以理解的指令和动作,同时也可以融入对于人的需要,周边动作的反应,这让智驾更接近于人开车,而不是机器思维带来了可能。

所以,智驾黑话再多,最终也要落到体验上,所言非虚,不管吹的有多厉害,最终实际丝滑稳定可解释的体验,会让车主做出最终的选择。#辅助驾驶功能#

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{feature?'撤销':'进'}}精选库
  • {{digest?'撤销精华':'设为精华'}}
回到顶部
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}