电厂 | 大模型应用,以快突围

新闻资讯2024-01-22 20:07:15橙橘网

电厂 | 大模型应用,以快突围


作者 商迪安

如果 2023 被普遍视为大模型元年,那 2024 毫无疑问将是大模型产品整合进一步提速的一年。

与此前人类历史上任何一次技术革命相比,生成式大模型的技术迭代都称得上前所未见,基础大模型的训练速度也随着版本迭代而提速。参数体积将比 GPT-4 大百倍的 GPT-5,预估训练所需时间甚至要短于前者。

在工具端,最受欢迎的往往是能直接提升用户效率、将生产力从繁琐的重复性工作中解放出来的产品。CES 2024 期间如雨后春笋诞生的上万款 AI 大模型能力整合产品,是这个时代最真实的写照。

从软件应用角度,这个趋势会更加明显:从微软在今年年初正式发布整合了包括 Office 办公套件在内的订阅大模型服务Copilot Pro,到诸如自然语言图像生成工具 DALL-E2,以及多次爆火社交平台的 Neural.Love AI 视频合成工具进入商业化阶段。以及 OpenAI 建立起的 GPTs 插件生态。


在国内,toC 端产品级应用也在以难以置信地速度推进:阿里旗下的夸克在今年 11 月下旬正式发布大模型之后,接连在健康与教育领域发布了两款产品,距离大模型本身发布仅过了 40 天。

有统计数据显示,在 2023 年下半年的 200 天,平均每天都有至少一款大模型问世。“快”成为了大模型领域最显著的特征。


大模型落地的快与慢

就实际落地的节奏而言,快并不只代表着快速发布产品抢占市场,也在于对全球领先技术的追赶:只有在真实场景的用户需求中才能迭代出能在市场竞争中获胜的产品。

在互联网行业,有一个经典的公式:用户价值=(新体验-旧体验)-替换成本。成功的互联网产品迭代无一不遵循着此定律,AI 大模型也不例外。

随着产品案例的越来越多,真正的商业模式创新会在未来三年内诞生。AI 大模型给行业带来“渐进式竞争”的本质,已经逐渐浮出水面。

在垂直知识密集、且对知识正确率要求更高的大模型应用场景:如健康与教育等领域,既是 AI 能最快改变体验的领域,也是最快暴露短板的“陷阱”。

比起传统需要用户在数十个链接中繁琐地提炼有效信息,甚至给出“腿痛解决方案是截肢”等让人啼笑皆非的答案,大模型具有精准识别出实际困扰用户问题所在的能力。但当前大模型的推理与梳理能力也远未真正达到专业如人类教师、医生的水准。这给看似激烈的竞争盖上了一层透明天花板。

想解决此类问题,就引入了 AI 大模型发展中名为“幻觉率”的概念。这一概念指的是当大模型给出了违背用户输入、和上下文矛盾或与事实冲突的回答。其中与事实知识冲突的幻觉正是目前大模型研究中的核心之一。


由于大模型幻觉有着不易察觉的特征,想要快速落地,就需要厂商已经在此领域有足够的技术积累。

以夸克发布的AI产品“夸克健康助手”为例,为了降低模型的幻觉率,夸克在大模型的预训练阶段,就需要进行大量的数据准确性校验和精调,同时签约了诸多行业专家让行业数据得到正确的应用。确保用户能够在熟悉的搜索引擎使用习惯中,借助大模型能力尽可能精准地匹配到相似病症的准确信息。

健康领域之外,夸克还在教育领域上线“AI讲题助手”,让大模型帮助学生更好地理解考点和知识点,通过详细的步骤和拆解学懂知识。跟以前搜索题目只出结果相比,大模型在教育领域得到了更好地能力展现。

而在用户最需要被改变的传统搜索引擎等领域,已经涉及到目前大模型能力整合的“深水区”,这让行业迄今为止的进展看起来稍慢了一步。

以搜索引擎为例,早在 23 年之前,大模型能力整合已经进行了多年:Google 力推的 Lens 图像识别,本质上就是结合图像与文本能力的多模态搜索,以及借助 AI 能力提供个性化的相关搜索结果。这些技术的累积即使对行业巨头而言也并非一蹴而就。

在这种渐进式的改变浪潮中,有优势的往往并非新时代最先起步的选手,而是在上个时代中积累更多经验的厂商:即使微软快速推出 New Bing,加入了大量 AI 能力,让用户数量与访问时长等数据有所改善,但在后续与 Google 的竞争中并未转化为有意义的市场份额。在 Bing 最核心的美国搜索引擎市场,3 月小幅提升到 6.61%的市场份额,到 4 月又回落至 6.44%。但 AI 能力整合后的New Bing 仍然在相当长一段时间内占据了用户之间的话题,成为微软在 AI 时代挑战Google 的第一步。


但从另一个角度,New Bing 的案例也说明,单纯的功能整合,也难以满足新一代用户对 AI 时代的想象:搜索引擎本质上提供的信息整合与深度内容的获取服务,需要主动预测用户在搜索结果生成后的进一步内容获取需求,很难在短期内通过 ChatGPT 的方式整合其中,这是 Google 搜索整合 Bard 之后相比竞争对手明显优势所在。


颠覆市场的窗口期

随着热潮逐渐走向实用,比起大模型本身,不少创业者已经意识到:除了快速布局之外,有相关领域实际产品大规模应用经验的团队同样至关重要。

即使是在具体的场景中落地,真正的竞争最终也会聚焦在有基础大模型能力与搜索引擎运营经验的厂商之间。无论是Google 将 Bard 整合进搜索,还是微软将 Copilot 整合进 Office,这些受到用户欢迎的快速整合无一例外。

而夸克作为互联网时代,从巨头垄断的搜索“红海”市场中成功分到一杯羹的团队,其核心价值是能够准确满足了以 00 后为代表的年轻用户的实际需求,一款定位极简、但懂你所想的搜索平台,精准捕捉到年轻人此前被忽视的声音,夸克才得以从中异军突起。

到了大模型时代,夸克想要复制上个时代的成功,仍然离不开在搜索引擎领域积累下来的经验。同时模型训练本身也依赖高质量的语料数据供应:这一点被学界普遍认为是当前中文大模型在与英文大模型竞争中最大的短板之一。


因为有高质量数据和搜索团队作为支撑,夸克在首发大模型60天后,有能力在12月、1月迅速发布健康助手、讲题助手乃至夸克元知等不同领域的三款产品。

其中,面向搜索引擎场景的“夸克元知”产品,将过去累积的搜索引擎能力结合多模态大模型在新时代落地。 能在搜索结果中整合全网优质内容,输出AIGC总结提炼的内容,再通过视频与图文等方式,辅助用户节省在搜索过程中的时间,更高效地获取信息。


根据工信部公布的统计数据显示,2023 年中国大模型市场规模将达到132.3亿元,同比增长率可达 110%。

在经过追赶海外巨头的阶段,随着行业焦点逐渐转向多模态大模型,马太效应已有趋势,“快”对于后来者反而更加重要:新玩家在窗口期之内,仍有颠覆市场格局的潜力,凭借能够处理多种内容形式的多模态大模型颠覆现有的用户体验。

与平台快速入局相比,虽然用户的使用方式被改变的脚步仍显缓慢,但改变已经悄然发生。” 属于多模态大模型产品的“iPhone 时刻”尚未到来。但在此之前会有一批优秀的产品被创造出来,占据千亿级的新市场。

在最直观“快”的观感背后,实际上考验着每一个大模型厂商的,仍然是在细分应用场景中过去的深耕,只有有了足够健康的土壤,大模型这把锋利的锄头才能有用武之地。

本文标签: 夸克  模态  ai  电厂  大模型  搜索引擎  

相关推荐

猜你喜欢

大家正在看