《深度体验后,和大家聊聊 Momenta 到底是一家什么样的公司?》 这次和大家深度聊聊 Momenta| 最近非常深度的体验 Momenta 的产品,也到北京学清路总部打了卡。还记得今年来这最多的是再往北走几公里的小米总部。 现在北京大部分的同事已经聚集在一个办公地,过去还比较分散,大家开个会可能“凑一凑”,现在一个大平层,容纳几百上千人,员工的一日三餐都包,如果晚上挑夜灯奋战的场景,颇为壮观。 Momenta 的人数没有我想象的多,只有一千多个人,市场部的人数更少,但大家都会觉得这就是“Momenta的风格”。 这次体验了 5.0 版本,和我预期类似,产品体验已经打磨超过了目前大部分头部自研主机厂。 让我没想到的是,曹旭东对产品的注重程度远超我的想象,我觉得他的风格以及用户敏感性甚至接近李想。除了他本人外,公司内部的产品和研发都必须上车。 我发现用户产品体验的leader做得好一般有几个性格,一般性子都比较急、触点敏感、学习能力超强以及具备全局思维的能力。 1|Momenta ,端到端了吗? 目前 Momenta 给到用户用到的软件版本已经是一个以端到端为主的算法架构,接下来会完全切入直接就剩一个端到端。 其实当时在做高速领航的时候,我当时体验到的版本在规划决策算法上其实已经用了数据驱动。 因为大部分算法强的公司一般的特性就是更“依赖”算法的领先性,比如会做预研,会更早做数据闭环。甚至 Momenta 行事风格是当官方在说这件事儿的时候,其实基本已经量产的差不多了。 2|体验有哪些不同? 如果感知是眼睛,规划是大脑。在规则时代,看到什么让大脑学习什么,这个过程是由我们人为来决定的。 端到端的意义,就是拿掉人工规则,让眼睛和大脑完成无损传递,看到什么、学习什么由大模型决定。这时候系统会有两个重要变化,系统会对环境理解产生了意识,道路不再是靠过去的高精地图的各种xy点数据结构,而是更接近人脑的结构,比如更好的理解前方200米右转的信息,和人一样有目的地意识。 而针对环境变化判断产生了直觉,比如绕行的动作也不是先看到、再预测、再规划再到控制,类似一个编程走完一个个序列,而是直接输出轨迹,体验更类人丝滑、聪明。 这是我这次体验 Momenta 版本最大感受,后续视频中再和大家进一步分享。 3|数据从哪里来?体验为什么能做好? Momenta 更多的数据是靠采集,而且这部分数据就是老司机直接车开回来的数据。回来之后进入仿真中和人类的差距做一个对比,通过不断扩大采集量得到更多高质量的轨迹,不断缩小大模型和人类的差距,最后做到让大模型越来越像人。 这也是 Momenta 所提到的“短期记忆”和“长期记忆”两个模块,短期记忆跑的是效率,能够像人一样学下来的驾驶习惯会沉淀在长期记忆中,而这样的训练成本会非常低。 我发现和理想定义一个老司机的标准再去数据库里挖掘不同,Momenta 更在意的是前期培养的“老司机”没有任何人工干预,而不是写好规则再学。通过不断扩大采集量,也就是高质量的轨迹提高模型的能力,直到越来越类人。 而前期挖掘只是一个补充,比如一些 corner case 补充需要挖掘。 4|我在深圳开得好,如何解决其他城市也能开、开得好的问题? 现在其实 Momenta 的 5.0 已经是全国都可开。5.0 我们理解其实是一个主线产品,不同客户拿到后其实都是一样的,只不过不同客户拿到这个版本后怎么定义、怎么推、时间节奏等是客户决定。 包括端到端实际也很早上车,比如奔驰、广汽就非常聪明,一早就传播端到端以及全国多可开。 其次大模型到来后,泛化能力其实也有明显增强。基本上大模型见过相对类似一些的场景的话,基本上都没有太大问题。 那不同客户有不同需求怎么办? 甚至合资车厂在德国或者日本有不一样需求怎么办? 这绝对是一个宇宙难题,这也是为什么 5.0 需要是一个强大的主线产品的原因,主线产品其实已经经过大量用户体验和客户需求定义下来的产品,比如效率、老司机的用户体验、具备智能的优化能力,这也才能做到说服大部分客户甚至海内外客户的原因。 接下来视频中可以和大家聊聊端到端后,体验到底会有哪些区别?可能相比学术科普大家可能会更加好理解一些。
最后编辑于 · 2024-08-19
  • 全部评论
  • 只看作者
  • 最热
  • 最新
  • 最早

请问飞机大哥,智己、广汽、腾势都在用Momenta的方案,理论上是不是他们的能力都是相当的?那为什么他们开城的数量是不一样的?像您所说,5.0已经全国都能开,但为什么以上几家都是个位数水平?主机厂按着不开放的原因是啥?

对,就是不同车企要求的不同,有些车企想要验证后才开,所以就需要按照开城开,不同车企宣发不同,内核其实是一样的

2024-08-19 回复 举报

回复 飞机先生但上汽是Momenta的投资方,理论上对智己Momenta肯定会有怎样的倾斜么?

能问一个问题吗,为什么车企比如理想小鹏等等在用双orin-x做城区智驾,供应商比如momenta元戎等等能用单orin交付,未来体验会有差异吗

其实就是最早的架构问题,早期这些供应商开始0-1做的时候就是一颗。其次是成本,供应商竞争比较残酷,多一颗成本高非常多。最后就是体验,一颗目前体验起来没有太大问题,而且接下来也能做到全国都可开。

2024-08-19 回复 举报

怎么理解“产品体验已经打磨超过了目前大部分头部自研主机厂”?评测里感觉每个主机厂智家都很牛,这个又超过了大部分,那就是说Momenta已经前和特斯拉、华为一个梯队,其他包括新势力都是二梯队?

对数据来源避而不谈,怕是说多了又抢车企灵魂了

能否聊聊 纯视觉和激光雷达 两种方案在端到端的差异性

区别在于对恶劣环境的适应性