大模型的商业化之路，会有多少团队折戟沉沙？

新闻资讯2023-11-03 00:07:53橙橘网

发布360智脑大语言模型后，10月底，360智慧生活相关负责人在一场发布会上介绍了进展：利用大模型能力，将训练好的模型拆分成多个不同小模型，供用户下载算法至终端上使用，某款户外球机销量已相较以往同类产品翻倍。

这是大模型技术不断向前演进的案例之一。此外，国内的小i机器人、商汤科技和云从科技等一众科技企业也不断迭代自己的大模型产品。中国绝大部分人工智能企业诞生不超过十年，它们要承受技术突破和商业变现的双重考验。

“沉淀技术就会花掉创业团队无数的时间和精力。从技术到一个产品，到最终满足商业客户的需求，尤其到商业化变现，会有无数的技术团队折戟沉沙。”小i集团董事长袁辉对第一财经记者表示。

“最大的不同”

垂直领域专有模型局限于细分领域或细分场景，通常参数量较小，需要通过人为标注数据“投喂”给模型训练，让模型从中学会规律并表现出智能。自2012年深度卷积神经网络提出，这类通过训练而成的垂直领域专有模型便开始兴起，取代了以往认为基于规则编写算法体现智能的方式。

直到大模型到来再一次改变AI形态。

“以往小模型采用监督训练，需要人为标注数据，行业内拉一个框（标数据）大概8分、1毛钱，要训练模型需要拉几十万个框，训练后的模型面向针对性场景。” 360智慧生活集团副总裁、360视觉云业务线总经理孙浩告诉第一财经记者，大模型的不同在于，大模型基于自监督或半监督训练，用大量数据训练模型，无须标注数据，大模型就能总结规律。只在针对特定场景用行业数据进行模型微调时，需标注一部分数据。随着大模型推出，AI走入新的赛道。

一名熟悉AI视觉模型的技术人士告诉第一财经记者，垂直领域专有模型此前训练复杂度高的缺点突出，体现在算法之间难以共通，针对不同场景的模型需分别训练，同一个模型针对人、宠物等不同检测对象也需分别训练。训练后的模型也只能“认出”特定目标，AI表现难言智能。大模型则避开了以上缺点，能从大量数据中自学习，且易于微调后应用于不同场景，表现出通用性。

垂直领域专有模型所需庞大的数据标注量，曾催生以人力密集为特点的数据标注产业，记者了解到，在大模型兴起后，不仅大模型训练的数据标注需求大幅下降，大模型本身还可用于标注数据，省去人工。

大模型在功能上也“颠覆”了以往的专有模型。孙浩表示，很多传统安防公司和AI公司此前发布了AI产品，在平安城市等项目有较大的落地应用，但几年前，深度学习算法就暴露出场景单一、泛化能力差的缺点。AI对检测目标需单独标注数据并培训算法，传统算法对长尾细分产品需求难以低成本覆盖，在家庭、中小微企业场景的落地表现难及预期。

以360为例，入局大模型后，360智脑-视觉大模型具备了不同以往的功能，包括开放目标检测、视觉问答等，前者基于语言描述检测画面中的特定目标，无需经过数据标注训练，后者能“理解”画面并用自然语言回答提问。360利用大模型的能力，将训练好的模型拆分成多个不同小模型，供用户下载至摄像头等终端。据介绍，端边云融合、大小模型协同后，算法精度提升了35%。

如同360集团一样，人工智能公司纷纷向大模型技术方向进化。

今年的6月，小i机器人发布华藏通用大模型，它在10月份进一步展示了其商业化变现的潜在途径。商汤4月推出“日日新”大模型体系，包括自然语言处理模型“商量”，近日发布了基于“商量”的医疗健康AI大模型“大医”，向医疗健康产业链上下游机构开放服务，推出的产品包括用药助手等。云从则于5月推出“从容”大模型体系。云从董事长周曦此前在业绩沟通会上表示，“从容”大模型后续版本的规划是以百亿模型为主体，走行业落地方向。

“过去人工智能的技术只能在某些特定的行业和场景当中进行赋能，大模型今天可以在同一时间，有机会有能力赋能所有行业。”袁辉表示，“这对于整个人类社会经济的发展，会起到巨大的降本增效效果。我觉得这是大模型跟过往AI最大的不同。”

商业化之难

大模型已经具有破坏科技巨头们原来有盈利模式的“潜力”。ChatGPT4发布之后，令行业震动，部分的原因也是如此。

“大模型出现之前是在网页上投放关键词的广告。但是今天大模型是怎么做的？无论你问什么问题，它只给你一个准确的答案，你的广告怎么投放？搜索引擎超级应用都会面临这一点，那其他的应用呢？”袁辉表示。

国际和国内大模型企业的商业化之路才刚刚开始。

商汤科技的上半年财报显示，今年上半年收入同比增长1.3%，亏损小幅缩小。该公司提到其生成式AI相关收入同比增长670.4%，对集团业务的贡献从2022年的10.4%提升至今年上半年的20.3%。据商汤方面透露，它联合国内多家科研机构，投入了约10000张GPU在大语言模型研发上。

从人工智能的发展历史来看，它的投资巨大，而商业回报一直以来都不乐观。

“人工智能60年以来，两次都失败了。任何一项技术走向社会，一定要创造经济和社会价值。”袁辉认为，“变现，这是整个大模型乃至人工智能行业，过去60年所面临的最大挑战。”

大模型技术还在快速演进，这会带来更多商业化可能。

360、海康威视、大华股份等安防企业，此前都是以AI视觉专有模型为主，进入大模型时代，大语言模型成为他们最早跨入，并尝试商用的领域。360目前已在应用的360智脑-视觉大模型是以大语言模型为基础、融合AI视觉技术而成，率先商用的商汤“商量”是大语言模型，云从“从容”大模型体系也涵盖了大语言模型。

孙浩表示，今年4月Meta发布了SAM(Segment Anything Model，分割一切模型），成为视觉领域一个重要事件。东方证券研报称，过去的图像分割为特定任务创建准确的分割模型，通常需要技术专家进行高度专业化的工作，还需大量的领域标注数据。SAM则能实现零样本下对任意图像进行分割，在新的图像领域上即开即用，无需额外训练。

SAM发布后，业界加速探索视觉大模型。GPT 4已增强了视觉等多模态能力，商汤推动“日日新”大模型体系中的 “如影”数字人生成平台和“秒画”文生图创作平台演进，云从“从容”大模型体系也纳入视觉大模型。

孙浩预判，视觉模型的“GPT3时刻”大概需要一年左右的时间才会到来。而未来在视觉大模型领域的竞争，企业是否有足量符合场景的数据供给大模型训练，将显得尤为重要。

中国绝大部分人工智能企业诞生不超过十年，它们必须走过从一张白纸到商业变现的过程。

袁辉判断，这不会是一个浪漫的过程。“沉淀技术就会花掉创业团队无数的时间和精力。从技术到一个产品，到最终满足商业客户的需求，尤其到商业化变现，会有无数的技术团队折戟沉沙。”

本文标签：算法袁辉视觉大模型商业化人工智能技术