{{detailStore.author.is_follow?'已关注':'关注'}}
ETC 的难度到底在哪里?写在深度体验之后... 最近在体验智己最新内测版本,也就是 Momenta 最新一代大模型能力,这次有一个重要的升级就是 ETC 。 Momenta 现在大概迭代了几代,现在最新一代叫做 EBM,这个英文缩写的意思就是 E2E Big Model 的意思,现在迭代到第 5 代,最新首发在智己上。 但和普通端到端大模型不同,这一代的模型是强调视觉为主,并且加上了语义的理解,语义直接参与了模型中。 现在我们说到视觉为主,那就意味着未来这个大模型交付成本可以做到非常低,可以不要激光雷达,而且现在看 Momenta 芯片各方面的进度,今明年成本会压制的更佳疯狂。 ★ ETC 核心要面对的问题是什么? 之前在美国,因为很少有收费站,所以 FSD 点到点的体验深刻感受就是丝滑。但中国这点是一个非常难啃的骨头,我也是体验后才知道这背后的诸多学问,和大家做个分享。 最初我以为 ETC 就是一个识别难的问题,后来发现比想象中复杂很多。 进出 ETC 最难的是导航提示进入收费站前,这个时候已经没有车道线,车道也变宽,环境参考已经没有意义,只有一个纯白的广场区域,这时候系统要做一次切割,让视觉大模型脑补轨迹继续走。 脑补后轨迹帮系统开到收费站前,这时候进入到视觉可以识别的范围内,就开始识别哪个是 ETC 或者人工,判断好后给规划输出一条进入 ETC 收费站的路线,完成抬杆后还要出收费站,这时候重复一遍广场区,再合流进入常规主路。 这套动作下来,先不说识别 ETC 难的问题,整个流程下来不能有任何延迟,因为进收费站不能停着看,而是快进快出。只能靠视觉大模型自己的能力,这在过去 rule base 时代下是完全做不到的。 ★ ETC 还面对各种复杂问题。 比如没法用提前采集 因为全国各种各样的 ETC 造型,不像高速道路一样更新频率低,ETC 也经常变,所以有收集成本、更新问题,如果要实现“全国都可开”的ETC,只能靠车端来解决。 比如激光雷达没有太大意义。 激光扫描出来的距离可能比视觉还短,结论是有激光雷达有用,但没起到核心作用。而且 ETC 要靠语义理解、还要识别快。车跑到 ETC 前不能停着给你看、再规划。 其次这套方案主要是要普及化,对成本更加敏感。 比如大广场无车道线的识别 大广场它不像我们过大路口一样,起码有左右转的方向信息,这时候只能靠大模型来脑补推理一个轨迹,还要确保这个轨迹够稳定,不会出现一旦道路变宽,方向盘突然抽搐、摇摆,这样用户体验就非常崩溃。 比如 ETC 的抬杆有些近、有些远,造型还各有不一。 识别后能否准确刹停,能不能识别杆抬起来等等。 虽然一个小小收费站,但无论是大模型能力、静态道路拓扑信息的推理、识别抬杆这种小目标物甚至还有收费站进站前各种方向车型的博弈,是一个集大成的复杂场景,但也是解决点到点通勤的重要拼图。
01:20
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{ is_favourite ? '已收藏' : '收藏' }}
  • {{ is_personal_top ? '取消主页置顶' : '个人主页置顶' }}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{ feature?'撤销':'进' }}精选库
  • {{ digest?'撤销精华':'设为精华' }}
回到顶部