大模型“全家桶”升级，企业怎么“啃”？

每日经济新闻 2023-09-12 20:25:22

值得关注的是，在“百模大战”的大浪淘沙下，剩下的“选手”数量最终可能仅仅是个位数。对于大多数企业而言，如何考虑更早在应用层发力，或是更为值得思考的地方。

每经记者｜石普宁每经编辑｜唐元

半年前，也许你身边只有“技术大牛”在研究大模型，而现在，经历了一波担心被AI替代的打工人，已经学会与之“共存”，并让自己更靠近大模型。而这种靠近的基础，在于企业的“百模大战”已来到一定的层级。

上个月底，多家公司表示旗下的国产大模型产品向全社会开放。而这距离国内较早的大模型产品公开发布还不到半年，大模型发展速度有着迅雷不及掩耳之势。

数据显示，截至2023年7月，中国累计已有130个大模型问世。毫无疑问，参与这场“百模竞赛”的任何一家厂商都不想错失这条看似蕴含无限商机的赛道。

记者认为，竞赛的实质是一场“云计算之争”。而这背后，大模型产品好不好用，还是要看能不能解决实际问题。

在此背景下，各大厂商亦在强调其应用层面的优势，特别是在结合垂直行业的场景中。目前看来，大模型与行业的融合发展已是主要趋势，具体的场景还在逐步探索，一批典型案例则已经发布。

率先发布大模型产品并投入应用，对企业而言的正向效应在于产生“数据飞轮效应”：即更多用户带来更多的数据，以此“反哺”更好的大模型，并无限循环。

率先“卡位”

对普通用户而言，如今要使用一款大模型更多需要考虑的是用哪一款，而不是“一模莫展”。

8月31日凌晨，百度“文心一言”、智谱AI“智谱清言”、商汤科技“商量”、百川智能“百川大模型”等公司纷纷表示，旗下大模型向全社会开放。

从时间的粗线条上来看，从发布大模型到“开闸”，等待并不算久。

百度作为较早公布旗下大模型的公司，3月便发布了“文心一言”；4月，阿里“通义千问”开始邀请测试。此后，各家大模型也陆续“官宣”。

监管方面，我国首个针对生成式人工智能产业的规范性政策《生成式人工智能服务管理暂行办法》已于8月15日正式施行。

图片来源：工信部网站截图

虽然各家大模型在介绍自身的产品特点上都各有侧重，例如强调公司对人工智能长久以来的专注，或强调其在特定语境下的更优表现，再或者表达自身对行业难点的突破......但终归目的只有一个，即在市场中率先“卡位”。

在此背景下，“应用”便成为了理解大模型的关键词。

首先，我们将它作为一个动词看，要想大模型解决实际问题，首先需要投入使用，也就是“如何应用”。

比如，9月7日发布的腾讯混元大模型，已经接入腾讯50多个业务，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等。

“我们研发大模型的目标不是在评测上获得高分，而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”腾讯集团副总裁蒋杰说道。

图片来源：腾讯全球数字生态大会公众号

再者，我们也可以把应用看做一个名词。面对形形色色的需求，大模型需要找到合适的路径或载体。类比安卓或iOS这样的操作系统，未来大模型的生态或许也将建立在无数的应用之上。

此前，我们在大模型“混战”一文里有提到，如今的IT技术栈分为四层，芯片层、框架层、模型层和应用层。今天的ChatGPT、文心一言等属于模型层，AI时代的原生应用都会基于大模型来开发。

业内一种观点认为，如果说ChatGPT的出现是人工智能的“iPhone时刻”，GPT4插件功能的发布则让人看到App Store（应用商店）的出现。基于此，称呼大模型为“轮子”也好，“底座”也好，无外乎不在突出其基石功能。

“模型本身是不直接产生价值的，基于基础大模型开发出来的应用才是模型存在的意义，对于创业者来说，卷大模型没有意义，卷应用机会更大。”9月5日，在2023百度云智大会上，百度创始人、董事长兼首席执行官李彦宏如是说。

图片来源：百度公众号

再进一步看，这背后更是一场“云计算之争”。

即便是采用开源大模型，算力便是一头不可绕开的“拦路虎”。此外，开源大模型的算法和数据亦有优化空间。因此，除了推出自研大模型之外，主要的云厂商在大模型服务方面亦在频繁发力，MaaS（模型即服务，Model as a Service）成为新的商业模式。

如何“落地”

生活、能源、金融、医疗、城市治理、科学研究……与更早之前火爆的元宇宙概念不同，伴随着各种“型号”的大模型，典型的应用场景正来到我们身边。

在公众的视野当中，采用图像大模型打造的产品是较早挣到钱的一批。

在这其中，闭源的Midjourney无疑是其中的佼佼者。不少报道都提及这家创立于2021年8月的公司，只有11名全职员工，不到一年便实现1000万用户和1亿美元营收的壮举。

据报道，目前Midjourney团队成员已经扩大至40名，这些员工今年有望为Midjourney创造2亿美元的营收。

另一方面，采用开源的Stable Diffusion，其部分产品也已实现商业闭环。典型的如7月推出的妙鸭相机，一段时间内几乎横扫社交媒体，不少用户都纷纷上传自己不同风格的“数字分身”。

据第一财经报道，妙鸭相机实际用到的技术并不复杂，应该是搭配了LoRA插件的Stable Diffusion开源模型。

图片来源：妙鸭相机公众号

在面向普通用户的热闹之余，企业的自有场景也成为重点关注对象。

实际上，迅速浏览一遍各大云厂商的打法，这一“玄机”便不是秘密。换句话说，消费者可以通过语言类或视觉类产品来“玩”大模型，企业则需要大模型及其产品以实现“降本提质增效”。

这方面已有一批典型案例。在北京发布首批10个行业大模型典型应用案例中，基于电力行业NLP大模型的设备运检知识助手示范应用、数字中医大模型示范应用、面向建筑领域多模态行业大模型示范应用等案例，都展现出大模型与行业之间的融合可能性。

图片来源：北京国际科技创新中心公众号

实际上，在目前来看，大模型应用场景显露的商机只可看作“小荷才露尖尖角”。

在上周才举行的2023 INCLUSION·外滩大会上，专家普遍认为大模型产品的产业红利才刚刚开始。

麦肯锡中国区主席、全球资深董事合伙人倪以理在现场预测，生成式AI的技术风暴有望开启一场关系到未来8-10年的新一轮技术和产业变革。“AI对全球经济的潜在收益将达到25万亿美元，是当前所有企业最重要的赛道之一，但这个时代刚刚开始。”

数据飞轮

什么是“数据飞轮效应”？GPT4给出的精简版回答是：

数据飞轮效应是一个概念，描述了数据、产品和用户之间的正向反馈循环。初始阶段，公司通过服务吸引用户，这些用户产生数据。随着数据的积累，公司可以分析这些数据，优化其服务以更好地满足用户需求。优化后的服务吸引更多用户，从而产生更多数据。这形成了一个正向循环：更多的用户带来更多的数据，而更多的数据又帮助公司进一步优化服务。

这也能解释为什么包括GPT4在内的几乎所有语言类大模型，都会在回复的同时提供反馈的按钮。