2023年,在以ChatGPT为代表的生成式AI的涌现下,AI又一次站在了科技的历史舞台中央,AIGC这个词持续升温,一直火到了现在。而这种火爆的现象大概率将继续延续下去。
在此期间,将涌现越来越多的AIGC应用场景,这里面即包含消费侧的应用,也包括行业侧、企业侧的应用。
近日,博鳌亚洲论坛 2024 年年会“AIGC改变世界”分论坛上,加州大学伯克利分校计算机科学教授斯图尔特·罗素,中国工程院院士、清华大学智能产业研究院张亚勤,高通无线技术中国区董事长孟檏,中国科学院自动化研究所、联合国高层顾问专家曾毅,科大讯飞研究院副总裁刘聪,猿力科技副总裁程群等嘉宾,就AIGC发展现状、趋势,人工智能发展所面临的挑战与风险,以及相关产业发展前景等问题进行了深入的讨论。
斯图尔特·罗素表示,虽然大模型的能力现在已经非常出色了,但是仍存在较大的技术缺口,而在罗素看来,模型不是越大越好,“我并不认为进行简单的扩展让模型越来越大,通过大量的数据训练就能弥合技术缺口,”罗素强调,“目前主要的问题是:系统无法从收到的训练数据中生成有用的东西,这就涉及到了模型构建的方式方法等方面的问题。”
同时,罗素指出,构建真正优秀的大模型需要开展国际合作,更需要加强监管,大模型的开发者需要更多的向公众“展示”模型的安全可靠性。
在过去的一年间,AIGC相关产业如雨后春笋般快速成长,整个行业可以说是“一天一个样”,对此,张亚勤也表示,在近一年的时间内AIGC发展迅猛,整个产业在一年的时间内产生了翻天覆地的变化,这种变化包括了技术、产品,以及生态等诸多方面。同时张亚勤表示早在2017年前后,就与斯图尔特·罗素就AI的相关话题展开过讨论,“时至今日,风险和安全的问题依旧是整个AI行业所需要面临的首要问题。”
与此同时,张亚勤还在会上对大模型未来的走向做出了研判,他表示,首先,大模型已经开始向着多模态的方向演进;其次,AI大模型已经走向了自主智能的方向,可以自主制定目标、规划任务,自我制定路径、完成方案、进行编码;再次,人工智能技术将进一步向边缘终端侧渗透,手机、PC、汽车等终端将成为人工智能发展的重要方向。
AIGC的火爆也对各个行业都带来翻天覆地的改变,就像云计算当初让每个行业都产生变革一样,AIGC也将会重塑每一个行业。会上孟檏表示,人工智能带来的创新不仅是让云端大模型产业具备交互式的能力,以及to C的一些应用,人工智能带来的是对每个人今后工作、学习、生活等方方面面的改变。孟檏以移动通信行业为例,他指出,在移动通信网络部署里生成式人工智能的应用能够改善网络的部署、减少耗电,减少功率的输出、对电池环境的改善都有帮助。
谈及大模型落地的最佳模式时,孟檏表示,混合式的模式更适合大模型的落地,“采用端侧和云上混合部署的模式,一方面可以保护端侧的数据安全和隐私,另一方面又具备云计算所带来的高弹性、高性能等优势。”孟檏指出。
虽然AIGC发展势头迅猛,但离真正的成熟应用尚且存在一定差距,针对此,曾毅表示,从行为上看,现在的AIGC还是会犯一些人类都不会犯的错误,产生一些“幻觉”的问题,这说明现在的人工智能系统还只是一个看似智能,但还没有达到真正智能能力的系统。
与此同时,曾毅指出,未来,整个行业需要关注的不仅是如何把人工智能做的更安全,“人工智能学习的速度远超于人类学习的速度,如果人类不去反思,最后给人类带来灾难性风险的不是人工智能,而很可能是人类自己。”这是曾毅对于人工智能未来风险的重要研判。
在AIGC的浪潮下,国内也有很多的企业积极布局大模型相关产品,科大讯飞就是第一批入局的玩家之一。刘聪在会上表示,过去一年间,中国在通用大模型和产业应用层面也做出了非常多的努力,包括颠覆了传统的编程,给科研工作带来了新的范式等诸多尝试。
不过,在刘聪看来,从现阶段发展水平上看,中国与国际顶尖水平仍存在一些差距,而未来企业之间主要的竞争点还是在底层的基础大模型能力方面,“我仍然认为现在整个通用大模型发展是系统性的机制,但是主战场我认为还是底座大模型。”刘聪强调。
除了基础大模型以外,在落地的应用和生态建设层面也将成为接下来国内外关注的焦点,在刘聪看来,通过与不同行业的龙头企业共建大模型,以及打造开放创新平台等方式,多管齐下,才能打造出高质量的,能赋能业务的行业级大模型产品。
确实,消费侧的应用仅是大模型展现能力的一小方面,大模型真正的价值和能力需要在行业侧展现,对此程群在会上指出,大模型技术在演化和推进的过程中还有一个重要的方向——与各行各业业务深度融合。
在程群看来,大模型的发展要遵循两个核心理念——一个是应用为王,另一个是以人为本。而这两个方面都有一个共同的导向——与行业深度融合,程群以教育行业为例分享了他对于大模型与行业深度融合的一些真知灼见,他表示,通过人工智能技术,更低边际成本地让技术流动起来,可以让每个人都能享受到高质量的教育,这是人工智能需要以人为本追求的一个方向。
以下为“AIGC改变世界”论坛实录,经钛媒体APP整理:
主持人:大家早上好,非常欢迎大家在博鳌论坛的今天议程中第一个环节选择了我们的论坛,非常感谢。我们的题目围绕的是AIGC怎样改变世界。
在过去的两三年让所有人都大吃一惊,包括科学家在内,我们看到AIGC打开了一扇新的门,让人工智能有一个巨大的可能接近人类智能突破的一种新的路径。我们在这个过程中看到ChatGPT,在ChatGPT之前已经看到了有GPT的1、2、3,通过这样一个模式阅读了人类过去所有的知识,开始接近人类的智能。去年和今年我们又会看到,尤其是今年的SORA又试图看人类所有的视频和音频因素,试图在物理世界建立一个模拟器。无论是文本还是视觉,似乎都通过AIGC的这样一种架构逼近未来可能的AGI。在这个过程中人工智能实现了非常大的突破,突破不仅仅在AIGC,所有的跟AI相关的研究都在大的路径上全面向前推进。还有两个重要的相关领域,AI在推动所有的科技变革,这是我们昨天另外一个讨论的内容。还有一块是智能机器人,不仅有大脑,最后还有一个像人一样的外形,这三块共同构成人工智能,改变人类经济社会和整个世界的重要三个支柱。在这个意义上我们非常快地在进入一个人类过去可能没有想清楚的未来,在这个未来中人工智能可能和人一样聪明,而且可能会是人类最好的助手,但是人类也充满了对未来的担忧,我们是不是会被取代。所有这些议题都令人极度的兴奋,同时也让人焦虑。因为我们有这么多重要的讨论,所以很快地进入到我们今天主要的议程。
首先有请斯图尔特·罗素,他是今天早上凌晨3点才来到博鳌论坛的,他在1990年代开始出了一本书《人工智能:一种现代的方法》,这本书是人工智能领域非常经典的教科书,在一千五百个国家被大家所使用。我们欢迎罗素教授跟我们简单做一个开场,两三分钟时间。
斯图尔特·罗素:非常感谢主持人的美言介绍,我非常高兴能够回到中国,虽然只是很短的一段时间。当然其实我想说的3分钟肯定是不够了,但是我们也只有这些时间。
首先我想要提醒各位,AI的目标到底是什么,我们到底要拿AI来实现什么?
在过去的75年,我们试图构建AI系统,能够在任何领域具备人类的一些功能,现在是时候我们要问这个问题,我们是否成功了?
我认为还没有成功,我认为大语言的性能,例如GPT4已经非常优秀了。如果我们生活在一个可以一触即发就能获取智能世界当中,会是什么样的感受。但是我还是相信有很大的技术缺口,而且我并不认为进行简单的扩展让这个模型越来越大、训练更多的数据就能够弥合这个差距,这个差距主要是:系统无法从收到的训练数据中生成一些东西。
可能现在的文本接受度已经能够比一般人阅读的量大数十万倍,但还是有一些基本的问题。这是因为模型构建的方法,他们是电路,电路是没有办法用语言来表达非常复杂的事件,它是需要更多的训练数据才能够理解一些概念。当然也是有一些突破的,可能甚至跟一些传统的AI方法有所结合,我们用了更多的表达性的语言,比如说编程语言,他们可以表达任何的事情,这也是为什么我们把图灵看作是计算机科学的使者。
如果说出现了突破的话,后面结果是什么呢?1951年图灵就问了这个问题,它说我们需要预计机器能够掌握控制,这也是我在过去十年思考的一个问题,我们如何在面对比我们更强大的机器的时候保持掌控权,这需要我们重新思考AI,证明AI的行为是能够使人类受益的。
当前我们所扩展的大语言模型好像黑匣子,是看不透的,它们能够满足的目标是我们现在不清楚的,这是错误的方向,我们不应该朝这个方向走。
在医学领域,比如你要在市场卖一种药,你要非常自信地表明这个药在市场上是有效的。还有核能,如果你想建核电站,必须要展示出它的平均故障时间是非常小的。所以有很多大语言模型的东西,它的性质和本质我们还不清楚,这点是需要改变的。为了改变,我们需要国际合作,在研究领域使得我们能够有高执行区间的陈述,同时在监管方面让这些开发者和作者能够展示他们的产品是安全的,谢谢。
主持人:非常感谢罗素教授,罗素教授给了我们一个全景式的论断,首先他认为我们还没有实现我们的目标,有很多的原因,下一步应该怎么做有更多的讨论。下面有请中国工程院院士、清华大学智能产业研究院张亚勤院士,您同意斯图尔特·罗素的观点吗?
张亚勤:90%同意,很高兴一年之后又回到博鳌,我记得去年大致这个时候我们有一个关于ChatGPT4的讨论,当时我们在谈大模型和ChatGPT对整个技术产业的变革,一年之后看到有翻天覆地的变化,不仅是技术,包括产品、包括对整个生态的影响都很显著。 第一点,我先讲一下大模型和生成式AI的关系,这两个一个是技术一个是能力,因为有了预训练的、超大规模的、自监督式的大模型,生成式AI才有可能有这么高的能量。首先大模型走向几个方向,第一个当然是我们现在看到的多模态,第二个是人工智能大模型走向自主智能,可以去制定目标、规划任务,自我制定路径、自我完成方案、自我编码。另外一个方向就是边缘智能,现在主要还是在云端,未来走向手机、PC、机器人、汽车。最重要的话现在整个世界智能信息在走向物理世界,也走向生物世界,所以我们生成式AI所带来的不仅仅是只能做一些语音识别、人脸识别、图像识别,现在它可以去创造和生成,不仅可以生成文字、图像、视频,还可以生成代码、药物、数学公式以及物理方程式,所以它会带来巨大的技术和范式的改变。当然改变有好的消息,也有一些令人担忧的东西,就是我们现在所讲的风险。我认为有三重大的风险,最近我自己花了不少时间和几位从事技术和研究的专家一起想这个问题。当然我是乐观主义者,我认为人类有两种智慧,一种是发明新技术的智慧,另外一种是引导技术走向的智慧,我认为我们一边发展一边可以治理,但是一定要现在开始在我们从事创新、发展的同时,一定要想到治理。”
主持人:感谢张院士,张院士从原来的阵营走向了另外一个阵营,这两个阵营的故事变化过程中也能看到两个路线,接下来我们再讨论。下面我们先进入产业,有请高通无线技术中国区董事长孟檏先生。
孟檏:人工智能是非常热的题目,今天早上这么多人,我想我们一定是整个会议最热的部分。时间关系我想从我自己日常从事的工作和所从事的公司角度,从应用人工智能的角度谈三点我们的看法。 一个是生成式人工智能或者通用人工智能是基于大模型的应用,刚才亚勤院士已经跟大家讲了这中间的区别。我们日常看到的一个很重要的就是,现在大家讨论的都是云端的大模型产生的交互式人工智能所带来的能力,包括人工智能跟人类的竞争,以及应用的时候像B to C的应用,但是我想讲的是本身人工智能带来的创新实际上不止这些,我们看到人工智能的发展,特别是生成式人工智能的产生,会对不光是我们每个人今后的工作、学习、生活带来完全不同的体验和变化,更重要的是它对我们所在的各行各业里面都有非常大的改变,所以大家不要以为生成式AI都是这些互联网公司或者做通用式大模型的企业的事,实际上对我们每个人所服务的行业都有非常重要的变化。
在座的有我们通信行业的同仁,在移动通信网络部署里很多生成式人工智能的应用能够改善网络的部署、减少耗电,减少功率的输出、对电池环境的改善都有帮助。这是我讲的小例子,大家探讨生成式人工智能对我们的变化。
现在大家谈大模型都是几千亿的大模型,我们看到有很多在比较小的比如说一百、两百一参数的基础上,不管是文生文还是文生图以及音乐的产生,这些应用在端侧的呈现也非常重要,具体的生成式人工智能的实现,我们认为是混合式的、端侧的和云端的,因为端侧对个人隐私的保护、对个人应用的体验有非常重要的应用。还有一个就是现在生成式人工智能的商业模式我觉得会很受挑战,一个是它的功耗非常大,再有一个对联网的成本也会增加,比原来我们传统互联网时代搜索所带来的成本要高很多,所以我们认为端侧上面或者边缘侧能够实现人工智能和端侧混合起来,能够更好地适应今后的发展。 第三就是科技创新和行业发展离不开行业合作,不管是大家谈得比较多的人工智能的国家治理、国际合作、标准制定,使得它今后的交互性可以全球都能应用,我觉得最离不开行业每个人的努力,也离不开所有国家的通力合作。我就讲这三点,谢谢。”
主持人:非常感谢孟总,孟总讲到端侧的计算,一会我们还可以进行更深的讨论。接下来邀请中国科学院自动化研究所、联合国高层顾问专家曾毅教授。
曾毅:我不能说我在联合国的舞台上特别是高层顾问机构当中代表的是中国,我是来自中国的专家,但是大家要知道联合国高层顾问机构总共只有38位专家,但全世界有将近两百个国家,所以我们代表的是学者和产业与联合国以及相关的政府对未来的人工智能,特别是它的治理问题、发展问题进行磋商,以及设计我们的未来。 首先我想说的是我们现在的人工智能,它只是一个看似智能的处理工具,人工智能最开始的时候设计的愿景并不完全是这样的,当大家看到人工智能作为一个学科出现的时候,当它谈到人类智能的学习和人类智能的方方面面都能够被精确地描述,以至于一个计算系统能够模拟它的话,我们认为这样的系统叫做人工智能系统。 什么叫方方面面?那就意味着不仅仅是它的行为,还有智能的机制,也许还有智能的结构。 行为上看上去接近人类水平的一些表现,但是在关键的、人类从来不犯错误的领域或者案例当中,不停地在犯人不犯的错误,这就说明现在的人工智能系统还只是一个看似智能,但是还没有真正智能能力的系统。
我必须非常清晰地说,现在的人工智能是看似智能的信息处理系统,但是它不具备真正的理解能力。1949年和1950年就提出了这个问题,但是当现在的人工智能系统跟你说“我想”、“我猜”等,他在劝说你他能够给你建议,但是对你说的内容它都不是真正的理解。
举个例子,我没有女朋友了,我的家人也不喜欢我,我的领导要把我开掉了,我该怎么办?最开始AI告诉你你最好就去死,因为绝大多数具备这些特殊的人都死了。所以人工智能并不理解什么叫失望,它只是告诉你一个具备显著性的答案。 大家要知道,所有人类的价值观等等在任何的场景下并不一定是能够穷举的,所以看似智能的信息处理必须改变一种方式,我们一定要追求的是真正意义的人工智能。 有些人说人工智能可以在行为上跟人一样,但是在机制上跟人类完全不一样。 我深刻不这么认为,当你和一个机制上、结构上跟你的智能没有任何关系,或者是它的基础完全不一样的智能体去交互的时候,你会觉得这是一件非常安全的事情吗? 就像我自己,我也许会尝试跟机器人握手,但是我绝对不劝说几岁的小孩跟机器人握手,因为它的传感系统一旦出现故障,它犯的错误是人类不可承受的。 人工智能现在看上去好像发展得接近所谓的AIGC,但是现在做的AI其实和AIGC还没有任何关系。 我认为一定要做的努力是什么? 就是真正地把真正意义的人工智能带给世界,服务于这个世界,当它出现可能的风险的时候我们要进行提前的研究,因为很多的问题是在几十年之内都不一定能够找到答案的,像我们谈到当智能的水平超过人类的时候,人工智能看待我们就像我们看待现在的小动物看待蚂蚁一样,当人类都不去保护当代的其他生命,未来的人工智能有任何的理由保护人类吗? 未来我们需要做出的改变不仅仅是把人工智能做得安全,人工智能的演化速度非常快,人类从历史当中学习、从自然当中学习的速度太慢了,这个时候如果人类不去反思,最后给人类带来灾难性风险的不是人工智能而是人类自己,因为人类自己没有在数亿年演化当中学会如何跟生态相处。 当生态当中出现了智慧水平比人高的智能,那才是人类最大的风险。 但我对未来仍然是乐观的,因为一个超级智能的人工智能也应该是超级利他的,所以我相信那个时候我们也许还有机会,但问题是我们现在构造的是不是一个超级利他的人工智能,我们是不是能把大自然演化的规律嵌入到人工智能当中,让它成为自然演化的延伸,让它去关注其他的生命,而不是给其他生命和世界带来灾难性的后果,我认为这是人工智能的技术研究以及未来人类演化都需要共同进化的方向,谢谢。
主持人:非常感谢曾毅教授,他提出一个重要的深刻的观点,我们目前人工智能发展需要一个新的不同点,这是一个非常重要的论断,显然曾毅教授是不同意斯图尔特·罗素的。我最近看到一篇论文,把过去几十年的人工智能发展做了很好的梳理研究,得出了人工智能的摩尔定律,每八个月人工智能的算力就可以翻一番,因为有这么强的算力支撑,我们只要把足够的算力放在一起,我们就一定会有好的表现。在过去我们把它叫做涌现,今天似乎涌现都不用了。在这条路径上我们会看到我们中国有非常多的大模型,尤其是科大讯飞,科大讯飞的星火模型是中国最强大的几个大模型之一,这个大模型我认为显然是遵循scaling law的,接下来有请科大讯飞研究院副总裁刘聪先生。
刘聪:首先scaling law在产业和路径来说还是关注的一点,但是同样的路径、同样的算力做到什么程度还要看各家。 今天非常高兴,很荣幸参加这场论坛,刚才几位专家更多是站在产业的角度结合我们自己过去一年多研发大模型,在技术创新、在产业方面的实践,在人工智能+的时代,如何用通用大模型赋能数字经济高质量发展。 刚才主持人开场也说了,这一波通用大模型浪潮席卷了全球,人工智能非常受关注,包括过去一年中国在通用大模型和产业应用也做了非常多的应用。 我们在内容的生产、在全自动地完成任务交互上,包括颠覆原来传统的编程,以及科研新范式,都在产生快速的进展。 在这个过程中我可能更多地谈在中国我们怎么样做通用大模型。 第一是因为在中国,我觉得我们自己现在跟国际上顶尖水平还是有差距的,这是一个共识,当然这个差距我们也在持续地追赶。 在中国我们有一个点就是关于自主可控,关于软硬件自主可控这块还是非常关键的点,我仍然认为现在整个通用大模型发展是系统性的机制,但是主战场我认为还是底座大模型,包括去年11月7号的发布会、开发者大会,如果我们单纯地只做一些行业的应用,可能它下一代的大模型到底流入哪里,是不是把现在的大模型颠覆了? 去年我们发布了国内首个飞行一号平台,星火3.5版本在中文常见任务上达到或者接近GPT4的水平,从这样一个角度,我们认为在自主可控的硬件平台上去研发可以对标国际顶尖大模型。 有了这样的大模型后,我们的行业应用其实有更好的发展舞台,用人工智能+非常有可能成为发展新智生产力的非常重要的引擎。 除了大模型之外,讯飞去年在各个行业有一些实践应用,首先是我们自己的一些产品,比如在教育我们的学习机主打因材施教,去年在学习机一个产品上就有九项大模型升级,更好地对孩子辅导、交互、答疑,当然我们也可以用大模型能力帮助教师在新课标框架下提升他们的备课效率。 医疗我们原来在基层医院,每个医生的诊疗助手在大模型支持下发布了小医,医疗不是效果做到95%或者99%就可以了,最后它是一个辅助,是由医生去判断。 代码也是我们在整个信息工业化非常重要的行业,通过代码大模型的能力,自己内部几千个研发人员用,在代码设计阶段能够提升50%的效率,在测试调试阶段提升40%的效率。 这些是讯飞自有产品,行业需要跟行业龙头共建,所以我们去年发布了12个共建行业大模型,包括跟交通银行、跟国家能源集团、太平洋保险等等,与各行业龙头共同打造了很多示范性的应用。 生态,因为讯飞也是首个国家开放创新平台,我们已经有超过六百万个开发者,其中跟大模型相关的开发者就有37万,增速是非常快的。 其实现在整个通用大模型都是方兴未艾的阶段,我们既要重视发展,也要讨论刚才曾毅老师说到的安全治理的问题。 站在企业的角度我们也会更乐观一点,如果它有价值,包括底座的研发、包括行业当中的应用,在降本增效、企业竞争力提升上这件事情是可以去做的,但是过程中要做边界约束和控制。 很多事情需要跟全球合作伙伴一起共建生态,在未来通用大模型的星星之火也可以在产业形成燎原之势,谢谢大家。
主持人:我们也祝愿星火大模型做得更优秀,我们看到讯飞现在也成为了中国的大厂,大模型领域科大讯飞迅速成为重要的平台。刚才刘总讲到我们中国的优势是什么,中国的优势有可能是有更大的场景、更多的数据、更多的应用,这实际上给中国未来的大模型和人工智能的范式或者说我们的模式提供了一种路径,我们的大模型也在不断向前进化,我们中国自己的大模型可能会弱一点,但是我们看一下最近的北京和上海两个大模型,我们会看到它的上下文窗口可以读一本甄嬛传。上海刚刚发布了一个MOE的大模型,MOE大模型路径和欧洲的Mistral(同音)路径是一致的,上海在这个领域也有全球最强的大模型。同时中国在行业应用领域,比如教育和医疗潜力非常大,所以在行业应用领域中国已经走在了全球的最前沿,刚才科大讯飞讲了自己的案例,最后请出猿力科技副总裁程群先生讲猿力科技的案例在教育领域我觉得这已经是全球最强大模型了,但是我有一点疑问,你觉得你的教育大模型强还是刘聪总的教育大模型更强大,有请开场演讲。
程群:我们的大模型其实跟刘总的大模型有区别,刘总的大模型是通用大模型,我们做的是垂类大模型、领域大模型,专注于教育场景的应用。 刚才各位专家说大模型技术演化、技术推进过程中还有一个重要的是与各行各业的深度结合、深度应用一定是大模型发展的一个方向。 我跟大家分享个故事,去年底我去了四川的一个偏远山区彝族地区,要走三个小时的山路,到了之后去学校看特别意外,第一点意外的是学校设施特别好,有可互动的大屏白板,我拍了照片给同事看,很多人觉得比北京的设备还好。 第二点是小孩子穿着很漂亮的衣服,但是普通话不是太好。 教育局长握我的手要请我吃饭,他说用了我们一款基于人工大模型的产品,一段时间后对他们帮助非常大,解决了他们最大的一个痛点问题就是学生辍学问题。 过去一段时间在这种偏远地区学生读书读着读着就出去务工了,最开始大家以为是家庭条件困难没钱不读了,其实不是,在这一轮过程中中国义务教育已经免费了,对于山区学生还有免费的营养午餐,大概率不是因为没有钱,而是因为学习没有兴趣,因为山区的老师变化特别快,很多支教的老师很快就轮换了,当地老师年纪大,有时候一个语文老师还得兼几个学科,学生觉得学习没意思。 用了我们的大模型产品飞向课堂,可以用大屏跟学生互动,大模型完成了知识传递的过程,将知识通过互动方式传递给学生。 线下的老师只需要负责课堂的组织,他是情感传递的过程。 学生突然发现学习是特别有兴趣的一件事。 校长给我举了一个例子,学生在课堂上问什么是相对论,老师根本没法回答,但是调用大模型就用一个通俗易懂的故事回答学生。 通过这个故事我有一个体会,未来大模型发展两句话,一个是应用为王,第二是以人为本。 应用往往就是人工智能大模型未来一定要走向应用,一定要走向大规模的应用场景相结合,才能推动技术的不断迭代。 第二个是以人为本,所有技术应该都关注每一个人、赋能给每一个人,特别是偏远地区山区的孩子,通过人工智能技术,更低边际成本地让技术流动起来,所以每个人都能享受到高质量的教育,这是人工智能需要以人为本追求的一个方向。
主持人:非常感谢程总,也特别感谢飞向课堂这样的大模型,可以让中国所有的孩子都读好书,当然应用为王也非常的重要。感谢六位嘉宾,开场实际上已经把我们所有的问题都覆盖了,而且观点已经非常鲜明了,特别开心还有半个小时的时间做更深入的讨论。第一个问题是问罗素教授的,我非常感谢知道您的联合作者和您的观点并不完全一样,您说我们现在还没有实现自己的目标按照这样一个范式,因为电路本身并不能够自动思考,它不能够理解,也不能够以正确的方式表达我们的知识,但是正确的方式到底是什么呢,我们是否应该走向更多的模拟计算?您同意这种观点吗?还有一个问题,下一个里程碑的突破会是什么?下一个里程碑将会是什么,和应该是什么,什么才是正确的里程碑?
斯图尔特·罗素:我发现大家的发言都特别有意思,虽然我特别强调风险这一面,AI的潜在好处也是巨大的,在我看来教育是一个现在的AI技术就可以带来巨大价值的领域,在本十年就能够做到,我们可以交付高质量的、个性化的教育给地球上的每一个儿童,在这十年内就可以实现,这样就使得AI成为非常值得发展的技术,科学研究也是特别会有效益的一个领域。 你问我另外一个方法,假如不是训练更大规模的电路,另一种方式是什么? 我想今年底或者明年初的时候我们会发现,在下一代GPT5,人们可能会发现它的培训材料已经是之前的十倍了,但那时候就是数据的终结,宇宙中已经没有更多的数据了,假如它没有带来真正的通用智能,那么我们就别无选择,必须去寻找不同的方向。 我不认为合成数据能够改变这个问题,因为它并不是真实的数字,真实的数据可能是不一样的,这是这个现实世界真正的人写了这些东西、说了这些东西,但是合成的数据没有真实世界的信息,它并不能够允许这个系统变得更有能力。 实际上这个实验似乎表明在大多数情况,如果你不断地去培训这个模型,不断地增加数据,它的表现实际上会逐步地退化。如果电路还不够,那我们就需要有一种更有能力的东西,我提到了这个逻辑和计算机程序。如果围棋要赢,可能是程序员写半页,如果是电路就要把围棋的系统写上一百万页,这就是为什么它要玩三千万棋局才能更了解规则。但是一个非常业余的围棋选手,它都能够打败有些程序,因为有些特定的围棋定式电脑或者机器没有得到正确地学习,而这些定式恰恰是围棋的思路或者说玩法。所以我们需要有一个更基本的东西、更基础的东西,在这里我们会听到这样一种说法,就是把概率理论和编程语言结合起来,这样我们可以去学习新的概念,使用一种表达式的语言来学习新的概念。这个技术迄今还没有像大语言模型那样得到发展,它还需要得到更多人类的干预,来创造出来一个结构模型。但是我想我们如果能够解决这个问题,能够解决少量的技术上的难题,它可能能够指出一些更有希望的方向来,它有希望是因为首先不需要大量的海量的例子去学习,而是从十个或者十百个例子学习就可以了。第二它的运行原则是我们可以理解的,我们可以分析这个系统进行的每一个步骤是什么意思,去检查它是否正确等等,这是技术文明的基础,也就是说我们了解每一个要素的原理,把它组成复杂的系统,我们就理解了这个复杂的系统。今天的AI恰恰是违反了整个文明发展的技术思路,我们并不理解这些系统如何运作,我们不了解它的原理,我们没办法设计工具,我们只是让它增长。实际上两三万年前驯化了狗和马,让他们保暖、让他们狩猎、给他们食物。现在我们有了计算机这个新的物种,我们并不了解它的原理,我们并不理解如何与它共存。所以我认为下一个里程碑将会是我们能否展示出来,我们可以使AI系统学习,并且像人类一样产生产品,同时它的内部运行机理是我们所理解的,这是我们努力的方向。
主持人:谢谢,非常深刻,而且是对未来的思考,尤其是对里程碑的思考。请张亚勤院士和曾毅教授一起加入讨论,刚才罗素教授讲得很深刻,也很清晰,又回到人工智能最早的一些争论,或者是不同的路径,看起来是连接主义和符号主义,还是需要大家能够共同往前走,现在连接主义已经冲到前面去了,一些科学家提出数字的计算跟我们给它输入的知识这两个体系在逻辑上似乎并不那么容易兼容,在这条线上我们如何才能实现罗素教授提出的观点?目前我们也看到一些新的世界模型也在走向多模态大一统,这是不是也能实现?张亚勤院士经常讲到新的架构,在现在这个特别耗能的架构外还有新的架构吗?先请张亚勤院士。
张亚勤:我先讲一下我对规模、法治scaling law的一些看法。scaling law在某种程度上是工程师的一个选择,由于过去三十年大规模的数字化产生了巨大的数据。第二是半导体产业一直按照摩尔定律或者超摩尔定律,现在已经快了很多了,这二十年算力增加一百万倍。第三个就是最近新出的几个算法,转换器和扩散结构正好利用了大量的数据和电脑大的算力,三个东西融合在一块,让规则和法规变得有效。我认为在未来五年左右scaling law还会出现很多,因为生物数据和物理数据会比信息数据大几个量级,算力还会增长,算法可能会是现在的框架,但这也是我担忧的地方,第一点,就完全用算力,不改变算法、没有新的框架的情况下是不可以持续下去的,算力带来更多的电力、更多的排放都是非常大的数目,2030年排放可能要占到10%左右,相当大。第二点,现在的算法框架效率很低,人的电脑860亿的神经元,每个神经元有五千到一万个突触,比我们现在最前沿的大模型大两到三个数量级,但我们现在不到三十瓦的电力是小小的空间。另外刚才大家都讲过现在我们对大模型还不是特别了解,它就像一个黑匣子,对它的了解不到5%,所以未来还有一些突破的空间。我现在在清华研究院正在做一些新的算法框架,把这个效率极大地提高,希望有一个更好的框架在五年后呈现。图灵是计算机的鼻祖,也是人工智能的鼻祖,当时图灵测试说人与机器人对话的时候,很多轮对话后我不知道对面是人还是机器就说明通过了图灵测试。ChatGPT出来的时候我感觉文字对话的方式已经突破了图灵测试,GPT4肯定会更好一点,未来两到五年当中,我们在图像、视频、影音方面通过图灵测试,SORA是一个重要的里程碑,但我并不认为它已经突破了图灵测试。在物理世界最快的可能是无人驾驶,我这几年一直在做无人驾驶,现在的无人驾驶安全性比人类驾驶安全性要高N倍,这个N是远远大于1的,再长远五年后我们可能会通过生物界的图灵测试,我们现在看到脑机接口,看到生物体和大模型去连接。这些东西能量很大,但是风险也很高,我们一会再谈谈风险。
主持人:非常感谢张亚勤院士,有请曾毅教授。
曾毅:问题是未来将走向何方、有没有不同的路径。 人工智能现阶段的进展可以用数据驱动的人工智能对未来做一个区分,所以现在的人工智能,当你有一个理想化的数据或者更大规模的数据,我要用一种数学优化的方法从数据的输入到我希望的输出找到一种映射关系,这种映射关系可以是数据优化的模型,当你找到两百个参数可以解决同样问题的时候,我想问大家,你会继续用几万亿参数还是两百参数来解决问题? 如果从数学优化的角度你可能真的会去选择两百个参数,我觉得这是机制问题,你几乎不可能用更小的参数描述它的时候,你用更多的数据去应对它,但这可能是人工智能驱动的代价。 未来我认为应该是机制驱动的人工智能,从自然的演化当中去学习人类智能的结构和机制。 对于行为的模拟,在行为上导致了它跟人类的接近,它仍然会犯人类不犯的错误,而且那种人类不犯的错误是很难进行穷举的,因为在结构和机制上它跟人类智慧有非常大的差别,即使人只能做60%的正确率,它能做到99%,另外1%的时候很多还是人不会犯的错误,你仍然觉得这样的智能部署到社会当中代价是不可能接受的。 我认为未来人工智能不应该选边站,以前我们说你到底是行为主义用规则系统,还是用连接主义用神经网络,科学的问题是人类确实非常善于解决逻辑推理的问题,但人类的大脑毋庸置疑它是一个神经网络胶质细胞以及等等生物细胞组成的复杂体,所以科学的问题是如何去采用神经网络和神经网络增强的结构,去产生高等的推理的能力,所以不同的路径一定要进行深度的融合,不存在此消彼长的问题。 所以我想未来对于智能来讲,我觉得我要讲的是关键是什么,关键第一个是人工智能什么时候有了自我,在我看来它才能真正解决思考的问题,因为没有自我的视角它没有办法进行根本的自我感知,很难产生真正意义的理解,没有个人经验也就很难把经验推己及人,不会有认知共情,也不会有情感共情,也不会产生利他,更没有道德的知觉。 现在的映射不是真正的理解能力,所以在我看来自我认知是第一位的。 第二是真正的产生理解,但是真正的理解它的根基在我看来还是自我,现在问题是既然你思故你在都是不成立的,如果机器没有自我的话,它能够产生真正的理解吗? 这是科学上一定要去跨越的。 最后我想说关键不是性能最高,我们在人类的智慧最高点在于它的自适应能力很强,不论环境发生多大的变化,它都具有很强的鲁棒性和自适应性,这是自然演化而来的,所以我们能不能把自然的演化原理融合到基于机制的人工智能系统当中,我认为这才是真正未来的人工智能。 如果我们没有解决关键的问题,在科学上的人工智能都没有走到正确的方向去,但是我们对于未来的社会来讲,我认为工业化的人工智能看似信息处理的工具会一直有用,但同时我们要解决可能的风险,问题是科学意义的人工智能已经几十年没有真正重大的突破了,这才是在我看来未来应当突破的,否则的话当大家看似信息处理的工具期望过高,有些人会说这一轮再也不会过去了,但是在我看来科学意义的人工智能如果没有取得突破,我们就很难构造出来与人类能够共生的人工智能。
主持人:非常感谢曾毅教授讲了很多的科学,我们这一次生成是人工智能重大突破的哲学,我们并不知道怎么去实现这些智能,让它看起来像,它就以自己的方式去实现了。刚才曾毅教授讲得不知道能不能实现,但是我们拭目以待。我们想产业的应用请嘉宾们再讲一句话,我们在产业的应用中我们的概念是要让大家把人工智能用起来,在某些领域用得很快比如说教育,但是某些领域用得比较慢,是什么力量能够让我们的应用快速地推开,这背后推动的最有力的力量是什么?
孟檏:我觉得还是技术的应用,技术驱动、供给驱动。
刘聪:技术回到产品中去,技术和产业共同融合,产业的需求和供给都有。
程群:我觉得最关键还是人,满足人的需求,特别是满足人们对美好生活的期待。