{{detailStore.author.is_follow?'已关注':'关注'}}
李想讲VLA司机大模型的训练过程,其实就相当于人类司机考驾照的过程: 科目一对应第一阶段:VL基座预训练。就是学会看路,车道线、路牌、导航信息,并且把所有的信息结合在一起,判断应该怎么开; 科目二对应第二阶段:辅助驾驶后训练。就是在驾校上车,找到开车的感觉,理论变成实践,端到端的训练开车基础技能,变道转弯掉头泊车等,先要开得稳,还要开得快; 科目三和科目四对应第三阶段:辅助驾驶强化学习。就是在社会道路上开,或者新手期有陪练,要随机应变社会车辆,基础的博弈,怎么开得更顺,别被加塞到动不了,别变不了道,也别瞎开。同时一些安全伦理和文明驾驶相关的内容,也要和人类价值观对齐。 第四阶段:司机Agent。就是变成老司机了,专车司机或者代驾,训练它能听懂人话,跟人交互反馈,从而按照人的要求去开车。(硬哥)
最后编辑于 · 2025-05-08
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{ is_favourite ? '已收藏' : '收藏' }}
  • {{ is_personal_top ? '取消主页置顶' : '个人主页置顶' }}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{ feature?'撤销':'进' }}精选库
  • {{ digest?'撤销精华':'设为精华' }}
回到顶部