{{detailStore.author.is_follow?'已关注':'关注'}}
日前小鹏的 @XP-Candice婷婷 总有一篇介绍智驾方面 AI 技术架构的科普文,前几天李想也在访谈中详细讲了这方面的技术方向,谈及包括 VLA 等很多目标规划。然后各路大神都有多翻解读,我也默默看了许多。 我发自内心想说的是,这些确实是涉及技术端具体方案层面,不是这么浅白的应用实体。对于具体工程开发规划人员来讲或许是可以用作推敲甚至角力的素材,但对于一般人来讲,要完全明白就很难有这个条件了。问题在于各家也都把这个层面部分信息摊出来变成一种宣传素材了,让一般应用层人士看到了,甚至用于作为眼前量产产品优劣的例证了,这就引来一些麻烦。极端的部分还会造成某些群体用很简单粗暴的一些片面数字进行对比,甚至拉踩。 例如说这个芯片单枚算力可以跑 30B 参数量,就可以想象,那用几枚岂不是可以跑之前说的云端 72B 大模型了?那不需要云端来蒸馏出车端模型直接可以让车端跑了?今天 @XP-阿莱克氏Alex 也做了一个简单比喻来解释了一下(看图一)。 当然我也问过相关专业人士,不管车端算力多少,云端那种模型不可能直接跑到车端的,无论在任何时候云端算力的充足程度和能力永远强于车端。车端受到很多的限制,包括算力跟编译等等。 其实大家也别笑话觉得车端可以跑 72B 的想法,对于一般人来讲是不是很容易会这么联想?毕竟大部分人不是具体从事这个行业的,哪怕是智驾爱好者如果这样想也不是因为蠢,只是应用层面跟真正行业工程层面人士确实有巨大信息差和理解门槛。 我也举另外一个例子,可能也会被一些博主鄙视一番,只不过我也得讲一下。例如理想会一直把训练所用的视频片段数量作为对外公开的参数,甚至内测的小版本号都以这个作为一个迭代数字。这个,咋说呢,当然在工程层面它代表着重要的意义,是训练数据的量级表现,从这个角度看,公开作为迭代数据本应没问题的。而落地的模型具体能力是诸多综合条件问题影响,不是就用这个数字就可以横向跟其他品牌产品衡量优劣的。但是,对于一般人来讲,你都亮出这么清晰一个数字,那不拿来做这个事情吗?肯定拿啊,特别是很多人都有这个需求,所以潜意识也是一种相互配合的结果。 我水平有限,对这方面一直也只能沉默,没能力具体评论优劣,从我个人理解是:各家现在讲述的技术结构都是在描绘一个蓝图,其实实现方案和技术在方向上都是一致的。只不过基于现在网络舆论环境,博主之间有各自阵营,很多人已经急于在这个阶段希望分出个差异和高低,有这个舆论需求。这方面,我想是不是应该静心等等具体产品落地,例如 @电动知士大雨 老师不也说嘛,眼前大家上车的模型也都还是 4B 左右参数量的,路还在前方,等现在蓝图大体开始上车的时候再用实际体验来 PK 也不迟啊,说不定到时候也都不错呢? 我不是为了一碗水端平,但如果必须现在去断言谁谁谁不行,谁谁谁牛逼,确实不是时候啊。
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{digest?'撤销精华':'设为精华'}}
回到顶部