小鹏汽车披露正在研发“小鹏世界基座模型” 在去年的这个时候,小鹏汽车推出“端到端大模型”,直接从输入再到输出结果的 AI 模型,那时候的小鹏在物理世界AI 取得重大的突破。而在4月14号的分享会上,小鹏汽车披露正在研发“小鹏世界基座模型”。 1、什么是基座模型? 小鹏汽车自动驾驶负责人李力耘表示,小鹏基模(基座模型)是一个以大语言模型为骨干网络,使用海量优质驾驶数据训练的多模态大模型,具备视觉理解能力、链式推理能力和动作生成能力。通过强大的强化学习训练,基座模型不断自我进化,将逐步发展出媲美甚至超越人类的自动驾驶技术。 2、小鹏AI算力堪比头部算力公司 为了研发基模,小鹏在2024年下半年就开始布局AI基础设施。目前小鹏AI的算力已经达到了10EFLOPS,是首个自动驾驶万卡智算集群,万卡集群主要是为了支持基座模型的预训练、后训练、模型蒸馏、车端模型训练等任务。这一系列的“流水线工作”,小鹏也称之为“云端模型工厂”。 该“工厂”的AI算力利用率长期保持在90%以上,高峰时期的运行效率甚至达到98%,也就是说从云到端的全链路迭代周期可达平均5天一次,这样的算力资源已经头部的算力公司。 3、为什么要做“世界基座模型”? 从端到端的路线演进到“世界基座模型”,主要的原因是什么呢?小鹏汽车自动驾驶负责人李力耘在分享会上表示,简单来说如果小鹏只局限在车端算力的一亩三分地,那么模型大小是受限的,只有超越车端的数据,才能实现车端的智能。我们要走到 L3、L4,这一切的核心就是要更加大、能吸收更多海量数据,把数据蒸馏出来放到车端的方法论,这就是我们要做基座大模型的原因。 4、小鹏世界基座模型:具备长思维链推理能力(优势) 小鹏世界基座模型的参数量目前已经到了72B(72 Billion,即720亿),是主流 VLA 模型的 35 倍左右。参数规模越大,模型的能力越强。同样的模型大小,训练数据量越大,模型的能力也会越强。 参数量巨大的同时,还具备链式推理能力(CoT),也就是说在充分理解现实世界的基础上,能够像人类一样进行复杂的常识推理,并将推理结果转化为行动,例如输出方向盘、刹车等控制信号,实现和物理世界的交互。 简单点理解就是未来在一个没有开放XNGP的地方,也可以很好的用XNGP,大模型在通过蒸馏,是真正可以具备自己的灵魂、自己的大脑。 在分享会的尾声,力耘博士也说了他曾经的一些经历,13年在美国博士毕业,那时候他应该是最早在北美从事自动驾驶的华人....在北美工作的几年,对他个人而言,他希望他的代码会真正赋能落地到每一个消费者都能买到看得见摸得着的产品上面,所以在这样的机缘巧合下,正式加入了小鹏汽车。 从英伟达的Xavier到Orin-X,从‌X PILOT到NGP再到XNGP。一步一步走来,谁也没有预料到智能驾驶行业发展如此迅速。而AI大模型的出现,也让我们看到自动驾驶比任何时候都更接近于落地。
  • 全部评论
  • 只看作者
  • 最热
  • 最新
  • 最早

大模型一步一步走向世界