国产大模型落地一年,商业化成效如何?智谱AI张鹏最新披露

新闻资讯2024-03-15 17:56:35橙橘网

国产大模型落地一年,商业化成效如何?智谱AI张鹏最新披露

“过去一年里,我们一共实现了2000+生态合作伙伴,1000+大模型规模化应用,与200多家企业进行了深度共创……”3月14日上午,智谱AI在京举办了主题为“智领,万象新生” 的小型媒体沟通会,智谱AI首席执行官张鹏介绍了大模型落地这一年所取得的成果。


图据智谱AI。

据南都记者了解,智谱AI成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,是国内最早入局大模型赛道的公司之一。智谱AI大模型落地一周年,究竟发生了什么?现阶段商业化之路走得如何?未来AI如何赋能产业智能化转型?

当天会上,张鹏分享了自己作为AI行业实践者的观察与思考。他认为,大模型技术需要时间和认知的积累,大模型商业落地能力同样也需要时间的积累。此外,人工智能发展会更加瞄准通用人工智能(AGI),实现超过人类水平的超级认知智能,实现AI的自我解释、自我评测、自我监督。

大模型落地一年,与200多家企业进行深度共创

回顾去年的3月14日,人工智能领域发生不少“大事”。

这一天,OpenAI发布其在深度学习方面的里程碑之作:新一代多模态大模型GPT-4。由OpenAI前员工分家创立的Anthropic也重磅推出全面对标ChatGPT的产品Claude。

谷歌同样不甘落后地发起了针对OpenAI和微软的反击,正式开放大语言模型PaLM API服务。几乎同一时间,斯坦福大学的大模型Alpaca(羊驼)火了,AI文生图工具Midjourney更新了V5版本……

“就像事先约好的一样,很多成果在同一天上线发布。当时许多大模型研究者、产品人员和工程师们都在社交媒体上欢呼:大模型里程碑日到了。”张鹏说。

事实上,那一天国内也有大模型重磅登场:智谱AI推出了千亿基座的对话模型ChatGLM,及其开源版本ChatGLM-6B。

2023年8月,智谱AI的生成式助手“智谱清言”成为首批通过备案的大模型产品,正式面向公众上线使用。两个月后,该公司又推出ChatGLM3模型及相关系列产品。今年1月,智谱AI发布了新一代基座大模型GLM-4,GLMs,支持更长的上下文,具备更强的多模态能力,个性化智能体定制功能也同时上线。

为了追赶国际领先水平和更好地满足中国本土客户需求,张鹏表示,过去一年智谱AI进行了4次技术升级,开源版本ChatGLM-6B全球下载量超过1300万。在商业化上,该公司也取得了一些进展:共积累了2000多家生态合作伙伴、实现了1000多个大模型规模化应用,并与200多家企业进行了深度共创。

回顾这一年,张鹏认为智谱AI交出了一份“还算不错”的答卷。一个重要原因在于,“大模型技术需要时间的积累,认知的积累,大模型商业落地能力同样也需要时间的积累。而我们并不是2023年才开始做大模型的。”他强调。

据张鹏介绍,2020年该公司就开始专注大模型算法研究。2022年8月,智谱AI发布中英双语千亿模型GLM-130B并开源,效果对标GPT-3。在这个市场还未火热时,智谱AI就已基于自身模型开始在做一些企业化的合作和交付,初期遇到许多磕磕绊绊,“跟着合作伙伴、市场一起摸着石头过河”。正是这个过程为后期大规模做企业交付时,提前积累了不少经验和解决方案。

在他看来,智谱AI最大的核心竞争力,是实现了大模型生成AI的全链路自主可控,专注做大模型的中国创新。智谱AI自研了具有完全知识产权的预训练框架GLM, 并自建训练平台,拥有从零开始搭建平台和运维平台的能力。

人工智能发展会更加瞄准AGI

当天沟通会上,张鹏还回顾了大模型发展的几个重要阶段。他提到,很多人认为2023年是大模型元年,但学界和业界更广泛的共识是大模型元年出现在2020年。因为从这年开始,全球范围内掀起一股大模型研究热潮,包括谷歌、Meta等科技巨头不断地发布百亿、千亿甚至万亿级别的大语言模型,只是这些模型暂未开源,也多为商用。

对于该不该发展大模型,当时国内的产业界和学术界也尚未形成共识;有人甚至提出基于成本的考量,比起大模型,更应该专注发展所谓的“小”模型。一直到2022年11月30日,Open AI推出引爆全球的聊天机器人ChatGPT后,“这才让大家真正意识到大模型能做什么,也因此几乎一夜之间,人们对必须发展大模型达成了一个高度的认识。”张鹏说。

与此同时,如何实现模型的产业化应用也被提上了日程。张鹏观察发现,随着ChatGPT的爆火,各家企业纷纷投身大模型赛道:短期内有的厂商利用大模型实现分类、聚类、情感分析等算法的升级;中期后更多企业开始研究定制化大模型,或者又叫垂直大模型——比如数学、化学、医疗等领域涌现了许多专用大模型;还有的基于现有算法框架训练注入不同数据训练出的各种模型。这些模型纷纷出现,让国内形成了蔚为壮观的“百模大战”场景。

及至今日,大模型行业发展已然进入下半场竞争,摆在各家面前关键是——怎么让大模型产生更大的价值,如何实现商业化落地?

当天沟通会上,张鹏发布了《智谱AI大模型商业化案例合集》,这些案例包含多个领域的头部公司,涵盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。其中还集合了该公司在大模型商业化中所积累经验与思考,介绍了企业在传统运营模式下遇到的业务痛点,以及如何利用大模型来提供针对性的解决方案。

南都记者关注到,2024年政府工作报告里首次提及“人工智能+”,明确要大力推进现代化产业体系建设,加快发展新质生产力。同时深化大数据、人工智能等研发应用,开展 “人工智能+”行动,打造具有国际竞争力的数字产业集群。

在顶层设计加强的背景下,人工智能如何更好地赋能千行百业?张鹏在接受央视网采访时表示,要把人工智能摆在核心的地位上,期待用人工智能技术来改造或者创造全新的生产范式。一言以蔽之,应当助推“人工智能+”,不是“+人工智能”,“把蛋糕做大,找到新的发展空间,寻求新的生产效果、可创新的空间,实现生产效率的大幅提升。”

值得一提的是,今年开春,Open AI又推出一大“王炸”,文生视频模型Sora发布后再次引爆科技圈。张鹏称,“Sora的能力实现了阶梯式的增长,这让国内大模型与世界先进水平的差距再次表面化。面对这样的差距,我们还需继续努力。”

同时张鹏表示,智谱AI全面对标OpenAI的产品线,是因为二者的目标理念相近,都是奔着通用人工智能(AGI)去的。不管是多模态、代码生成、搜索增强,还是Agent(智能体)能力等,这都是探索AGI过程中必经的技术积累阶段。

在他看来,人工智能的发展会更加瞄准AGI,实现超过人类水平的超级认知智能、实现AI的自我解释、自我评测、自我监督;同时为确保机器自动对齐人类价值观和安全标准,超级对齐技术也在开发中,用以实现模型的自我反思和控制。

采写:南都记者李玲 发自北京

相关推荐

猜你喜欢

大家正在看