地平线征程 6 平台也是可以上 VLA 的。 ★到底什么是 VLA? 第一代端到端主要是系统一(端到端)、系统二(VLM)为主。 系统二像老师,系统一是个学生。系统一做不会的问题就问老师,老师答。 但难题在于老师不太会开车,所以老师很难出一个精确轨迹执行开车,所以只能传递信号给学生,并不高效。 VLA 把它们合二为一,没有了老师和学生的关系,而是合成一个大脑系统,老师变成了直接参与了决策,学生负责执行,而不是传递纸条的关系。 ★地平线的 VLA 叫做分层式 VLA。 去年地平线发了一个论文,主讲了一个 Senna 模型,感兴趣的同学可以翻阅。 分层其实也是一种话术,简单理解就是系统二 VLM 本身是视觉语言模型系统,所以它只负责更高维的决策模型。他比学生有经验,更懂复杂的世界环境。 比如懂路上的交警、泥头车等特种车,还包括 SR 中我们看到的各种具备三维能力的推理信息,可以告诉学生你怎么开。 而端到端本身胜在一些精确数值的预测,更会算,比如处理一些规划轨迹的预测,变道、绕行、窄路的通行等,轨迹出的更类人和丝滑。 这样一来 VLA 很好避免过去我们体验的一些系统明明看起来决策很老司机,执行起来却崩溃了,也就是有下限问题。还有一些执行起来一部分很“端味”但有一部分有浓浓的“规则感”。这些都因为加了规则,干预了一些体验。 所以 VLA 它不是一个算法,更好的理解应该是一个架构。它改变的不是单一某个体验维度,而是整合系统本身。所以今明年上了 VLA 系统的软件,体验有很大不同。 ★SuperDrive不是重点,重点是明年有很多“小SuperDrive ” 地平线征程 6 最大的作品就是 SuperDrive ,第一个客户签订落地的时间是今年三季度,这样反而给地平线留足了开发时间。 而且比较恐怖的是地平线不是单芯片、单软件作战。明年有大量的小“征程6”芯片,小“SuperDrive”软件上车,还有更具吸引力的价格,这才是最具重要性的。 最近有大量媒体同学一起实测,也会释放很多体验的信息,大家可以围观…
最后编辑于 · 2025-01-05
  • 全部评论0 条
  • 只看作者
  • 最热
  • 最新
  • 最早

前排沙发空着~

还没有人评论哦,快抢沙发吧!
写评论
积分赞赏
点赞
评论区
  • 收藏
  • 举报
回到顶部