“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型将改变世界。”5月26日,在2023中关村论坛上,百度董事长兼CEO李彦宏在主题演讲中这样说。
最近一段时间,人工智能再次成为人类创新的焦点,围绕AI的军备竞争比以往任何时候都更加激烈。从OpenAI到微软、谷歌、Meta,再到国内百度、阿里巴巴等等,全球科技巨头纷纷扎堆杀入大模型之战。越来越多的业界人士认可第四次产业革命正在到来,而这次革命正是以人工智能为标志。
生成式AI和大模型的涌现,是全新的计算范式带来的新机会。在李彦宏看来,大模型成功地压缩了人类对于整个世界的认知,让人们看到了实现通用人工智能的路径。如同在移动互联网时代所有应用都值得重做一遍,大模型时代,各行各业也将不可避免地被重构,百度要做第一个把全部产品重做一遍的公司。
大模型改变人工智能
为什么说大模型改变人工智能?
李彦宏在演讲中表示,这是因为大算力、大模型、大数据,导致了“智能涌现”。过去的人工智能是想让机器学会什么技能,就教它什么技能,“教过的有可能会,没教过的就不会”。但大模型导致智能涌现后,以前没教过的技能,机器也能够学会了。
与此同时,人工智能发展方向从辨别式走向生成式。过去人们熟悉的人工智能应用大多是辨别式的,比如人脸识别、搜索引擎,就是把人们要找的东西在全网进行匹配。而如今崛起的生成式AI,人们已经可以利用AI进行文学创作,写报告、绘制海报等等,大幅度提升人们的工作效率。
大模型正在重新定义人工智能。从技术突破角度来看,一个体现就是大模型重新定义了人机交互。
过去几十年信息产业的发展,人机交互方式发生了三次变化。李彦宏举例,在自己读研究生时,命令行是主要的人机交互工作界面,只要输入一个命令,它就能给你想要的反应;到了图形用户界面(GUI),也就是用鼠标一层一层点击菜单,这种方式比命令行更友好,但它仍然不是最自然的交互方式;直到人工智能的诞生,让人们可以用自然语言跟电脑进行交互。
他举例,当他想查一下某个月百度有哪些产品的毛利率,超过了疫情前的水平时,在过去很可能需要助理花半天、一天的时间才能获得,但是在今天,如果计算机懂人类的自然语言,一秒钟之内就可以给出一个表格。
从底层技术看,大模型对于人工智能背后的技术栈,也带来了根本性的变化。
过去,无论是PC还是移动时代,IT技术栈都是三层,芯片层,操作系统层,应用层。芯片层的代表公司有英特尔、AMD、高通等CPU企业;中间层是操作系统,在PC时代是Windows,在手机时代是安卓和iOS;再上面是应用层,PC时代所有的人都给Windows开发软件,在移动时代所有人都给安卓和iOS开发应用。
但是到了人工智能时代,IT技术栈变成了四层:底层仍然是芯片层,但主流芯片从CPU变成了GPU。百度在芯片层的布局是昆仑芯,已经量产几万片,昆仑芯第三代预计2024年初量产。芯片上面是框架层,也就是深度学习的框架,如百度的PaddlePaddle飞桨,Meta的PyTorch,谷歌的TensorFlow等;再上面一层是模型层,如ChatGPT、文心一言等,百度在模型层的布局,除了文心一言,还有交通大模型、能源大模型等行业大模型。再往上是AI时代的原生应用层。
在大模型时代,云计算的游戏规则有望彻底被改变。过去,云计算主要卖算力,看速度、看存储,未来企业客户选择云厂商,更多地去拥抱AI、使用AI能力,主要会看云的模型好不好、框架好不好。业界预计,云计算的主流商业模式将从我们最熟悉的IaaS,逐步变成模型即服务,MaaS。
产业变局:大模型重构各行各业
在产业应用层面,大模型引发的AI再造产业趋势已经势不可挡。
李彦宏此前预测,大语言模型将带来三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;第二类是进行行业模型精调的中间层企业,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
如今,AI时代的原生应用已经开始出现。例如,美国DoNotPay是一个用AI帮人打官司、写法律文书的应用,AI帮你把不该付的钱要回来。营销创意的生成工具Jasper是一个通过Al帮助企业和个人写营销推广文案的应用。Speak则是韩国一个学外语的应用,大模型成为一对一的教师,为每一个孩子提供个性化教育。
李彦宏认为,未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型。大模型会深度融合到实体经济当中去,赋能千行百业,助力中国经济开创下一个黄金30年。
事实上,百度也正在用AI原生思维重构所有的产品、服务和工作流程。例如,百度的如流智能工作平台,让每一位员工都有一个具有丰富专业知识、实时响应的工作助理。通过对话理解能力,就能实现聊天记录的智能总结。
李彦宏说,百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,是重构。
与此同时,目前市场对于大模型的需求非常旺盛,人们拥抱新技术的热情前所未有。以百度方面数据为例,截至目前, 超过300家生态伙伴参与文心一言内测,在400多个企业内部场景取得测试成效。此外,已经有15万企业申请加入文心一言内测,覆盖政务、金融、媒体、电商零售等行业。其中,内容创作、智能客服、办公提效为各行业通用的高频需求场景。
大模型改变的,不只是产业层面,还包括我们每个人。通用人工智能(AGI)发展引发的一个热点争议在于:机器会不会取代人类工作?
在李彦宏看来,把机器变成人,不应该是努力的方向。机器会越来越聪明,能够干的事越来越多,效率会越来越高,人类需要与机器共生,而不是二元对立。他援引研究机构观点,在未来10年,知识工作者的效率可以提高4倍。
以自然语言人机交互场景为例,未来的应用是通过自然语言的提示词来调动原生AI 应用实现的。“这意味着,未来你的薪酬水平,将取决于你的提示词写得好不好,而不是取决于你的代码写得好不好。”李彦宏说。
他提到,自己做过一个预测,10年后,全世界有50%的工作会是提示词工程。“提出问题比解决问题更重要。我们的教育要教孩子提出问题,而不仅仅是解决问题。”
为什么是百度?
今年3月16号,百度启动文心一言大模型测试,展现了AI在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的能力。文心一言也在飞速进步,据了解,文心一言内测一个多月,完成了4次大的技术升级,QPS (每秒查询推理响应速度)提升10倍,这代表着推理成本已经降低为原来的十分之一。李彦宏在演讲中透露,很快将会推出文心大模型3.5版本。
百度率先发布生成式大模型产品背后,李彦宏“技术改变世界”的理想从未因为外界的压力而改变。他在今年的内部邮件中说,自己最近这几年,不断跟百度的同学们讲困难和挑战,为的是当机会来临时,能够抓住机会,勇敢创新。因为只有创新能够驱动增长。他称,要用科技让复杂的世界更简单,坚持做正确的事,帮助实现人工智能的终极理想,“为人类带来更多的自由与可能”。
技术基因一直驱动着百度持续成长。长期以来,百度深耕人工智能领域,早期的投资奠定了百度在人工智能浪潮中的有利地位。财报显示,2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。
在芯片、框架、模型、应用等四个层面,百度是行业中为数不多拥有全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,大幅提升效率。
李彦宏此前还表示,算力可以用钱来买,但创新不能,而是需要自建。上述四层架构在实际应用中,的确已经在一些领域大幅提升了效率。
例如在智慧交通方面,通过智能调整红绿灯的时间,可以让城市交通效率提升15%到30%。李彦宏举例,今年五一长假之前最后一个工作日,北京大堵车,从二环堵到六环一片红,唯一绿的地方是亦庄,是因为亦庄300多个路口全部部署了百度AI信控系统。
与此同时,中国大模型在构建在国产技术底座上,和每一层都实现自主可控,意义重大。
“我们坚定地相信全球化,走开放的道路,但在关键环节要开发自主可控的技术,关键的技术要掌握在自己手里。”此前李彦宏的这番表态,具体落到企业层面就是要实现技术“自主可控”。李彦宏在演讲中表示,文心一言做到了数据可控、框架可控、模型可控,能够体现在国际竞争当中高水平的科技自立自强。
演讲中,李彦宏还提到了人工智能技术飞速发展过程中,确实有可能出现对人类不利的方向,对此如何防止AI失控等话题。出于对AI的潜在担忧,目前全球范围内都在陆续加强有关人工智能治理的相关监管 。
李彦宏提出,这需要拥有先进AI技术的国家通力协作,从人类命运共同体的高度来制定规则。而要参与规则的制定,就要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。