{{detailStore.author.is_follow?'已关注':'关注'}}
CVPR2026上,很多人都关注到Ashok展示这页PPT,但只关注了数据,却忽视了特斯拉想要表达什么: 特斯拉FSD的7路摄像头x36帧x500万像素x30秒历史,除以5x5的像素框,相当于输入20亿的token。再加上导航、100Hz的运动数据、48Hz的音频,最终模型只输出2个Token(转向+加速度) 这个过程也代表真实世界中,驾驶变量组合是指数级爆炸的。输出的两个Token可以是多种参数,到底哪两个才是最正确的?似乎没有标准答案。 特斯拉的解法,不是只靠仿真,只靠人去制造场景,而是通过规模化的车队数据,直接喂给AI,让它形成条件反射,让模型拥有举一反三的能力,这或许就是智能。 所以试驾过FSD V14的人,往往会提到一个词——“认知”,你会觉得它的驾驶决策和方式与人类一模一样,甚至会表现出优于人类的能力。
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{ is_favourite ? '已收藏' : '收藏' }}
  • {{ is_personal_top ? '取消主页置顶' : '个人主页置顶' }}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{ feature?'撤销':'进' }}精选库
  • {{ digest?'撤销精华':'设为精华' }}
回到顶部