ChatGPT打响大模型热潮第一枪！人工智能大模型火爆全年的背后

新闻资讯2023-12-28 07:52:24橙橘网

来源：环球时报

【环球时报报道记者赵觉珵刘彩玉】编者的话：即将过去的2023年在人工智能（AI）发展史上或许会留下浓墨重彩的一笔。从ChatGPT掀起的一片浪花，到席卷全球的浪潮，人工智能大模型成为当下最受关注的话题之一。

从文字对话交互开始，AI大模型在短短一年多时间内对人们的生产和生活带来巨大变化，并且被普遍认为将继续带来颠覆性影响——这包括对人类生产力的提升，也同样蕴含着难以预估的风险。

国外：ChatGPT打响大模型热潮第一枪

去年11月30日，美国AI公司OpenAI发布旗下基于大语言模型GPT-3.5的AI聊天机器人程序ChatGPT。据美国媒体报道，在ChatGPT上线时，OpenAI没有开发布会，也没有进行什么预热宣传。几乎没有人预料到，在发布后的短短两个月内，ChatGPT的月活用户突破1亿，成为史上用户增长速度最快的消费级应用程序。

流畅的语言表达、强大的问题处理功能以及庞大的数据库，尽管有诸如“胡言乱语”等缺陷，但ChatGPT仍然让人们亲身体验到现代人工智能已经变得多么强大。《纽约时报》称，ChatGPT为“有史以来向公众发布的最佳人工智能聊天机器人”。比尔·盖茨则公开表示，ChatGPT的诞生有着重大历史意义，不亚于互联网或个人电脑的诞生。

ChatGPT的横空出世深刻影响了全球AI产业的发展轨迹，AI大模型吸引了大批科技巨头、初创企业与科研院所入场。北京市科学技术委员会、中关村科技园区管理委员会日前发布的《北京市人工智能行业大模型创新应用白皮书（2023年）》统计称，从全球范围看，世界各地均在积极推动大模型研发和应用，其中美国和中国发布的通用大模型总数占全球发布量的80%，成为大模型技术领域的引领者。

在美国，微软借助对OpenAI的投资与合作，将GPT模型嵌入旗下Office等产品；谷歌在今年年底推出新一代的多模态大模型Gemini，被业界认为开启了与GPT的直接对决；近期有外媒报道称，亚马逊正在训练其第二个大语言模型，该模型拥有2万亿个参数，可能会成为当前世界上正在接受训练的最大模型之一。此外，一系列初创公司也全力投入大模型之中，由OpenAI前高管达里奥创办的Anthropic、拥有强大创始团队的Cohere等初创企业均受到关注。

在大模型基础上，生成式人工智能（AIGC）也迅速发展。国际研究机构IDC本月发布的一份报告预测，2023年全球企业将在生成式人工智能解决方案上投资160亿美元，到2027年，支出预计将超过1400亿美元，年复合增长率超过70%，几乎是同期全球IT支出年复合增长率的13倍。

过去的一年中，可以将文字描述转化为图片的AI工具Midjourney、AI视频生成软件Gen-2等都曾引发用户的惊叹——“AI改变世界”这句话正在成为现实。

在发布ChatGPT之后，OpenAI一直都保持着领跑者地位，GPT也被其他大模型作为对照标准。今年3月，OpenAI正式官宣多模态大模型GPT-4，新增了图像功能，同时具备更精准的语言理解能力。与此同时，OpenAI也从一个非营利的研究机构走上商业化之路，目前估值已近千亿美元。

在这一过程中，OpenAI发生了一场全球瞩目、多次反转的人事变动，创始人奥特曼在11月被董事会突然解雇。经过复杂且激烈的多轮博弈，奥特曼重返OpenAI并重新担任首席执行官，为这场“大戏”暂时画上句号。一家公司的“宫斗剧”能引发如此巨大的关注，既与OpenAI和奥特曼本人的业界重要地位相关，也侧面反映出AI大模型的重要性正提升至一个新的高度。

2023年，尽管没有中美如此大规模的投入，但其他国家和地区在AI大模型领域也不甘落后。今年5月，阿联酋阿布扎比科技创新研究所的Falcon大模型问世；今年9月，据媒体报道，日本政府联合NEC、富士通、软银等大型科技公司投入数亿美元，开发日语的大型语言模型；韩国互联网公司Naver推出了HyperClova X；印度政府主导的大模型Bhashini也已投入使用。

国内：“百模大战”，与行业融合是重要机遇

自3月份GPT-4上线后，国内科技企业纷纷跑步入场。百度“文心一言”、阿里巴巴“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“言犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场。

除通用大模型外，不少企业也推出了深耕行业、具有专业能力的垂直大模型，例如携程的旅游行业大模型“携程问道”，网易有道发布基于教育的大模型“子曰”，京东健康发布医疗健康行业的大模型“京医千询”等。此外，清华、复旦、中科院等高校与科研院所也在大模型领域深度布局。有统计显示，截至10月，国内已经发布238个大模型，这让不少人形容称，当前的中国正发生“百模大战”。有评论认为，国内正在逐渐形成互联网巨头通用模型领跑，AI厂商、创业公司及科研院所百花齐放的格局。

在技术水平上，一些国产大模型已经取得突破。百度创始人李彦宏在今年10月发布“文心大模型4.0”时称，该模型综合水平与GPT-4相比已经毫不逊色。而在同月发布“星火大模型V3.0”的讯飞则表示，其产品已经超越ChatGPT（GPT-3.5），并计划在2024年上半年实现对标GPT-4。

360创始人周鸿祎对《环球时报》记者表示，客观来讲，中国大模型和GPT-4相比还存在一定差距，但这种差距不妨碍我国打造自己的GPT和自己的大模型产业。

互联网分析师于思远接受《环球时报》记者采访时分析称，中国虽然在基础研发技术上还存在一些短板，但具有超大的市场规模以及丰富的应用场景，可以为大模型的落地应用提供广阔的空间和条件，这将成为中国发展大模型的特色路径。

有分析报告统计称，从大模型的类别来看，国内通用领域的大模型共有45个，垂直领域的大模型则有145个。而垂直领域中又包含43个细分赛道，其中以医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多，均为10个及以上。

周鸿祎认为，中国的最大优势是拥有行业红利或者叫场景红利。中国发展大模型的关键就是抓住场景红利，最大机会是产业化、行业化、垂直化，向深度定制方向发展。周鸿祎建议称，大模型可以比现在的粒度更细，比如在钢铁、金融、教育行业，可以把这些行业里的很多环节、链条、任务都细分出来，利用大模型赋能。

华为推出的“盘古”大模型与京东推出的“言犀”大模型都是目前国内以服务产业为主要目标的大模型产品。前者已经与政务、煤矿、金融、制造、医药研发、铁路等诸多行业进行结合，后者则致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景。

李彦宏近日在一场论坛上说，未来我们需要的是100万量级的AI原生应用，而不是100个所谓的大模型。大模型时代，真正的价值在于AI原生应用，对于中小企业来说，对于创业者来说，都是很大的机会。

未来：憧憬变革，也要防范风险

在过去的一年里，AI大模型的发展和应用达到了新的高度，不仅在技术上取得了显著进步，还在多个领域中展现出了广泛的应用潜力。

中国科学技术信息研究所党委书记、所长，科技部新一代人工智能发展研究中心主任赵志耘近日表示，大模型技术最大的突破就在于通用性。大模型通过“大数据+大算力+强算法”的路径显著增强了通用性、泛化性，推动人工智能从以专用小模型定制训练为主的“手工作坊时代”，迈入以通用大模型预训练为主的“工业化时代”，迎来新的发展浪潮。

展望未来，赛智产业研究院院长赵刚认为，未来大模型的发展将有三大趋势：一是通用大模型性能提升和优化进一步深入，大模型将进入万亿参数，性能进一步提升，同时围绕不同应用场景进行模型调优；二是大模型的思考和探索能力将进一步提升，将从简单智能应用向复杂智能应用迈进；三是大模型的超级应用将出现，将整合内容生成、语义理解、推理、记忆、自主意识等能力，提供体验感极强的智能服务，智能数字人或机器人等将成为经济社会各领域的标配。

AI大模型的飞速发展将掀起新一轮的生产力革命，并为正在艰难复苏的全球经济注入新能量。然而，它也带来了一系列麻烦和隐忧。从学生利用AI写论文，到网络上利用AI合成的图片和视频制造的虚假新闻，再到知识产权、伦理以及“人与AI如何相处”的宏大命题，这些必须全世界合力解决。

不久前OpenAI内部出现的动荡，背后正是折射出人类对AI不同发展理念的激烈冲突和碰撞。美国《华盛顿邮报》当时报道称，这场斗争围绕着两种趋势的分歧展开，奥特曼希望推动人工智能技术快速发展和商业化，而其他人则对可能产生的安全问题日益担忧。

今年5月30日，以马斯克为代表的350多位国际人工智能业界领袖和专家发表联合声明，称应当将人工智能危机视为全球优先事项。这份声明称：“人工智能可能导致人类灭绝，危险程度不亚于大规模疫情和核战争。”