{{detailStore.author.is_follow?'已关注':'关注'}}
全网猜了一周的 Open Rounter神秘模型,是小米的 MiMo-V2 。 大佬果然都是大佬,做之前一般默不作声,霸榜后就草草认领了[允悲]罗福莉和@雷军 雷总正式官宣,小米MiMo-V2大模型家族正式发布。 为什么叫大家族,因为这次小米拿出了 MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS 三个系列,在OpenRouter平台大家关注度非常高的Hunter Alpha、Healer Alpha,也是这个系列的内测版。 之前Huter Alpha 已经累计被调用了 1T tokens,在 openrouter 登上了日榜,之前这个模型大家都误以为是 DS 的 V4 版本,罗福莉就是前 DS 的人,然后在小米上做出了全网都以为是 DS 的模型,哈哈。 MiMo-V2-Pro 总体算力比之前的 Flash 前一代提升了 3 倍,激活参数量 42B,参数量增长很快,但推理效率并不低,罗福莉在推上说了架构的切换,不是顺应潮流。而且在定价下这次API 的价格也比较低,这也可以看到小米大模型的策略也很明确,就是要撬动起来小米的开发者生态。 MiMo-V2-Omni 是一个基座模型,统一了感知到行动,更多模态的加入进来,比如把文本、视觉甚至音频都接入进来。 MiMo-V2-TTS 主要是让这个 Agent 学会开口表达和说法,不仅仅是会思考。大量的训练,模型的可以围绕一些特殊的音色、和不同场景表达出来的语气都会更加自然,甚至说一些方言,还会唱歌之类。 罗福莉也在X上提到,其实这个1T基础模型在月前就开始训练,最初的目标是提高上下文推理效率,小米用到的一些架构比如混合注意力架构其实不是去跟随主流,而是在建立之前就要知道这些好架构的优势。 这句话太深刻了,智能驾驶最早期,吴新宙就说到一句一模一样的话,当时高速NGP才出来,他明确在技术发展的早期,架构优势在前期非常重要。 而小米推出的人车家生态战略,现在除了在手机OS,汽车智驾、车机我更为关注,在SU7最早一代的人车家互联大家并不认可,对于小米来说,小米一直缺乏一个可以调用这些跨设备、跨系统甚至到跨域的一个中枢,它要了解进来的不同场景,还要懂这些场景的意图,最后还能跨设备去调用,甚至还要会表达。 而相比智驾和座舱交互,我们这些更贴近上层的应用,很多时候也忽略了底层模型的能力。 就像大家现在只看到 FSD和 Grok,但背后的逻辑和战略思考更为重要,这背后不是仅凭算法和芯片手搓几下就出来了。 我觉得过去我们1.0时代卷了大量的智驾和大算力,2.0时代就是反而要往底层打地基做推土的事,要带从完整的 AI 体系能力、到推理规划、到感知再到语音表达,这套能力形成的整个智能中枢才是那个真正的围墙。 最近小米也正是官宣 XLA 智能驾驶,今晚应该会多聊一些。 所以 MiMo 为之重要,就像罗福莉说的,这不是一个对话产品,而是一个真正能做事的Agent。
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}
写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{ is_favourite ? '已收藏' : '收藏' }}
  • {{ is_personal_top ? '取消主页置顶' : '个人主页置顶' }}
  • 举报
  • 加入黑名单
  • 内容{{ eyes_only ? '公开' : '仅自己' }}可见
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{ feature?'撤销':'进' }}精选库
  • {{ digest?'撤销精华':'设为精华' }}
回到顶部