电车随记006 - 关于大模型在车机上面的价值闲聊🤔_文章

Wei的百分之一

2023-06-08

关注

电车随记006 - 关于大模型在车机上面的价值闲聊🤔

文章

这篇就是想到哪儿, 写到哪儿, 不会很严谨~

这篇文章的输出主要是解决自己对这几个问题的看法

大语言模型的到来究竟给车机带来什么样的价值提升?
企业是否要投入大语言模型? 投入的效益在哪里?

回答以上几个问题, 先有一个基本思考框架

一般车企的痛点有哪些?
用户体验痛点有哪些?
大语言模型在现阶段以及未来几年会具体带来什么样的价值?

先说大语言模型带来的变化, 最大的一点就是让科技触手可及 , 简单来说

以前你需要通过一段代码、需要自己各种剪辑、需要自己各种查找、需要自己各种规则式表达来制作一个应用、一个视频、一个知识框架、一个web页面, 这是建立在有一定专业能力和堆人力资源的情况下才能实现的 .

现在有了大语言模型, 你可以“一句话交互“, 通过一句话的表达就可以更快速的查询知识脉络、生成代码、生成图片、生成页面、生成视频、生成音频、生成workflow等等, 这种只要工具得当, 你可以只要贡献你的表达能力和思维逻辑就可

前后对比就是一种工具使用门槛的降低, 科技技术的触手可得~

所以现在有了各种 text-to-text、audio、image、video、avatar、website、UI、code、PPT&Excel、信息查询和决策、RPA等等技术工具和应用展现. (去ProductHunt上面看会发现国外很多基于Chat GPT的工具都是在以上各个维度产生, startups做这种工具提高用户和客户的生产力, 通过订阅式的方式来获取用户收益)

一定程度上面大语言模型带来的价值有:

自然语言的交互, 让用户或者企业客户输入门槛更低
生成式的输出, 让输出效率更高 (现阶段不保证好用)
提高生成力, 让人力资源释放, 降低人力💰成本, 指长期

那么车机上面的体验痛点有哪些呢? 主打没太多“人味儿“

语音交互像个stupid machine, 听不懂你说的
界面上面堆满千百个功能features, 难找, 可能八百年不会碰一次, 明显的功能堆叠资源浪费性价比不高
车机故障了, 无法快速定位问题并给予车主相应的解决方式和安抚措施
难以满足个性化的创作, 都需要通过厂商先预设规范式的命令,才能排列组合去形成用户需要的场景

企业开发痛点有哪些呢?

太多人力的堆叠但换来体验过剩的功能输出, 尤其是体现在智能座舱和智能驾驶语义理解和数据标签等训练上面, 另外一种程度的消耗人本身主观的创造性. (当然这儿要算一笔人力细账)

我前期一直认为ChatGPT会带来用户体验式的极大提升, 这种自然语言表达式的会让用户学习成本更加简单, 可以做到

生成式的UI, 不再靠规则去开发功能、开发应用了
根据描述自动生成场景组合, 不再靠规则去场景编排了
可以一句话就查找想要的内部讯息, 不再靠人工训练语义了
说什么它都有可接受的回答, 真正的很有人味儿的“十万个为什么“
车子出故障了, 它能够在故障码协议栈里面跑一圈就可以定位到问题, 并且主动交互告诉你“问题在哪里”“应该怎么解决”
让它基于刚刚拍的车外图片自动生成一个视频上传到app去发布, 它也可以做到...
让它自动生成一个图片当桌面
让它变个声音来和我聊天
....

但从用户体验来说, 生成式UI和现在这种规范制作的UI给用户带来很大的体验差异吗? 加入了大语言模型的语音交互就比现在的语音交互(以小鹏语音为例)就体验很大很大么? 不见得, 而且最为关键的是很有可能高成本投入, 用户短长期不会用金钱买单, 大概率还得是免费提供 . 就比如说现在的车机够用吗? 现在最好的语音交互够听的懂吗? 其实已经大致可以满足用户的体验需求了 ~

更大的价值提升是对内的! 我们就不用堆那么多的人力去认为的做功能features、做功能布局、做开发、做场景编排, 也就是不用按照现在规范式的去开发一个车机了, 不用去想方设法去给某个功能整一个特别的命名了. 从这种角度而言, 价值更多的是开发人力资源的释放, 人力成本的降低, 人力投入到数据采集、模型fine-tune、定规则的工作、找场景应用了. 到了一个新的时代, 用新的技术元素组合再去满足人的需求.

所以我认为大语言模型带来更多的价值是新技术重构已有的技术架构, 让开发效率更快、迭代更迅速且人力资源投入更低, 而从最终用户端的体验提升来讲不会有很质变的变化, 对于使用这种工具的企业或者个体会有质的变化. 本质来讲它是生产力工具, 在车机领域, 更多的是to 内部, 而不是to 用户.

举个不恰当的例子, 如果研发生产力因为大语言模型可以从现在的50%提高到未来的90%, 但用户体验端可能是从现在的70%提高到75%.

但作为企业不得不去考虑的一点就是, 你不得不去用这个能力去重构内部生产力, 因为有人会通过很好的利用这个, 跑的更快, 给用户的体验优化更加迅速, 慢慢的就形成高强度的用户体验粘性了.这是一个短期看不到价值, 长期需要投入的事情; 这也是一个用户不会主动买单, 靠新的技术手段来提高用户体验的事情.

此外还想表达一个观点, 我们一直考虑的是触控为主, 语控为副的智能座舱表达心态, 但是在车机这个系统中, 随着大语言模型从可用到好用的转变, 一定会是语控为主, 触控为副的表达形态, 因为人在车内的环境, 手离不开方向盘, 那么交互方式就会转移到人天生的嘴上面来了, 现在自然语言技术相对成熟了, 可以开始工程化布局了, 所以资源倾斜和技术布局就要做相应的倾斜处理.

当然无人驾驶到来的时候, 车子里面只要一个移动iPhone就可以了. 那块固定的屏也不要再固定了. 这个另说

现在大语言模型还是在技术造轮子的时候, 除了text-to-text已经从可用过渡到好用的阶段之外, 其他的我认为还是在prototype的阶段, 还无法真正的产品级在车机上面工程化落地, 比如生成式的图片和故事也没到用户会买单的地步,而且投入成本还会很高.

再过五年, 大模型打通了车机的底层协议和指令集, 做到生成式UI的表达, 能够工程化的时候, 那时候应该会很有意思~ 开发人力的投入主要是在找什么样的reviewer和做什么样的instructions了~