智东西
作者 云鹏
编辑 李水青
智东西5月11日消息,今天一大早,苹果AI炸了锅!
一边彭博社曝出猛料:苹果马上要跟OpenAI签署协议,将ChatGPT相关技术用在iPhone里。
另一边,《纽约时报》曝出苹果Siri即将发布的一系列重磅生成式AI升级、背后研发细节,以及苹果顶层高管做出要给Siri做“大脑移植”这一决定的幕后原因。
外媒AppleInsider则报道称,苹果将把实时录音转录、文本摘要总结等标志性生成式AI功能用在语音备忘录、笔记、消息、Safari等核心系统级应用中,做“系统级AI”。
在当下这波以大语言模型为基础的生成式AI热潮中,苹果毫无疑问是落后了,以ChatGPT为代表的聊天机器人应用已经火遍全球,但苹果至今还没有明确动作。
以苹果公司CEO库克为代表的高管不停地向外界传达“苹果很重视生成式AI”这一观念,但最终大家关注的还是苹果到底要怎么做AI。
今天,关于苹果AI的更多关键问题,似乎都有了更清晰的答案。苹果的生成式AI大招,我们已经能够窥见一隅。
一、拥抱OpenAI?苹果做AI选择两条腿走路
苹果做AI到底是单干还是合作?目前来看,苹果大概率是会“两条腿走路”。
据彭博社报道,苹果即将与OpenAI达成一项协议,在iPhone上使用OpenAI的相关技术,将ChatGPT放到iPhone中(Put ChatGPT on iPhone)。根据这份协议,苹果将在未来发布的iOS 18中使用ChatGPT功能。
双方谈判仍在进行中,协议尚未最终达成。
但值得注意的是,ChatGPT此前早已在苹果的App Store中开放下载多时,iPhone用上ChatGPT,已经是过去时了,所以此次苹果与OpenAI的合作,或许更多聚焦于背后的模型层面,将更多“ChatGPT的能力”接入到iPhone中。
据彭博社报道,苹果也在与谷歌就使用Gemini大模型问题进行商谈。
二、苹果要给Siri“换脑”!从根上治病
说完了合作,我们来看看苹果自己的AI到底要怎么做。据《纽约时报》报道,Siri将会成为苹果做生成式AI的关键抓手之一。
据报道,其实从去年年初,也就是ChatGPT刚火的那阵子,苹果公司软件工程高级副总裁Craig Federighi和苹果公司机器学习和AI战略高级副总裁John Giannandrea就已经做出决定,要给Siri来个“大脑移植”。
没错,治标已经不行了,苹果要直接给Siri换个脑子。
这两位高管都是苹果发布会上的熟面孔了,也是直接向库克汇报的苹果核心高管,可以说,苹果的AI要做成什么样,库克和这两个人是最核心决策者。
据报道,这两位高管花了好几周测试OpenAI的ChatGPT,这促使他们做出了给Siri“换脑”的决定。
有熟悉Siri的苹果人士透露,当时ChatGPT写诗、写代码、回答复杂问题几乎无所不能,这让Siri看起来有些过时。
三、Siri十三年后,苹果发动十年来最大规模内部改组
2011年,Siri作为最早的一批智能助手出现在了iPhone上,只不过那时的“智能”还较为初级。十几年来,Siri一直聚焦于处理一些个人请求,不具备对话跟踪能力,误解问题是家常便饭。
什么是对话跟踪?比如你问ChatGPT旧金山天气怎样,然后紧接着问它“纽约怎么样?”,ChatGPT会明白你是在问纽约的天气,但Siri就不知道。
毫无疑问,Siri的能力已经被大幅赶超了,在技术层面,Siri已经落后了。这促使苹果这家科技巨头进行了十多年来最大规模的内部改组。
据报道,目前生成式AI在苹果内部已经成为了一个“支柱型”项目,一个“a tent pole(帐篷杆)”的项目,“帐篷杆”这个叫法是苹果内部特有的,用来组织苹果员工参与这场十年一遇的创新大项目。
可以肯定的是,苹果正全力以赴在这场AI竞赛中迎头赶上。
四、Siri将拥有一套新的生成式AI系统,端侧大模型“幻觉”或成挑战
苹果的决心我们都明白了,那“换脑”后的Siri究竟会变成什么样?
目前各路报道都认为苹果会在6月10日举办的WWDC24上发布升级版Siri,也就是苹果的重要AI大招之一。
升级后的Siri会更能聊,功能也会更加丰富。据三名相关知情人士透露,Siri的基础技术将会包括一套新的生成式AI系统,这套系统会让Siri和ChatGPT一样具备真正的“聊天”能力,而不仅仅是“一问一答”。
2018年之前一直在苹果工作的Siri联合创始人Tom Gruber说,Siri一直想拥有一个可以理解语言和上下文的对话界面,但这一直很难实现。
据三位知情人士透露,苹果并不会发布一款“类ChatGPT”应用来直接与ChatGPT竞争,苹果的重点是让Siri更好地完成手头的既有任务,比如设置计时器、创建日程安排、在购物清单上添加心仪的商品,当然,新Siri也可以总结文本信息。
苹果在宣传新Siri时,可能会更侧重标榜其“私密性”,因为Siri处理所有的请求都将是在“端侧”完成的,也就是在iPhone上处理,而不用“上云”。
这侧面可以帮苹果省下一笔不小的费用,要知道,ChatGPT每生成1000个单词就要花OpenAI 12美分。
当然,苹果这种做法不是没有弊端的,iPhone本地运行的模型规模有限,这种较小型的模型最容易出现的一个问题就是“幻觉”——编造出一些事实上本不存在的答案。
值得一提的是,苹果在iPhone 15系列上还提前把内存升级到了8GB,这被认为是给新Siri提前做的准备之一。另外苹果也在跟谷歌、OpenAI、Cohere等公司商谈AI大模型相关授权问题,提前做好准备。
五、更多重磅生成式AI功能落地系统级应用,关键功能仍需端云协同
除了Siri,据外媒AppleInsider报道,苹果准备将实时录音转录和摘要总结功能应用在多款产品中,并且这个功能会是“系统级”的,也就是说,不论是你是看视频还是开会,都可以录音并总结重点。
苹果的语音备忘录(Voice Memos)应用将是首批获得这一功能升级的应用程序之一。
此外笔记(Notes)应用也会升级,支持基本的文本摘要、总结功能,加上内置的音频录制和实时转录选项,苹果这个系统级的笔记应用可能会成为生成式AI落地的一个关键应用。
这对于学生上课记笔记以及商务人士参加会议来说都会是一大福音。
苹果希望利用AI技术提升自家几个核心应用程序的效率。目前苹果正在测试这些功能,准备在今年的iOS 18中发布,当然,这些功能也会被用于macOS以及iPadOS中。
据报道,转录和摘要功能只是苹果今年AI升级的一部分,预计类似的摘要功能也会应用于Safari浏览器、消息(Messages)应用中。
Safari将支持网页总结,而消息应用则可以提供消息内容的“浓缩版”。
虽然苹果计划在端侧运行AI,但音频转录和高级AI摘要可能暂时仍然需要云端的辅助。
六、生成式AI或颠覆iOS和安卓,苹果iPhone怕“变砖”
生成式AI新技术的到来,为何会让苹果如此“紧张”?据两位熟悉苹果高管想法的人士透露,苹果高管担心生成式AI会威胁到苹果在全球智能手机市场中的主导地位,因为生成式AI所能够创造的“新生态系统”可能会彻底取代当下的智能手机操作系统,包括iOS和安卓。
值得一提的是,目前国内有荣耀这样的手机厂商已经提出手机操作系统需要用AI“重做一遍”,可以看到,生成式AI对智能手机这类产品的影响,一定是深入操作系统底层的。在这点上,顶级科技巨头们“不谋而合”。
基于新的生成式AI技术实现的AI,如今也被称为“智能体”,这个智能体实际上就是一个“AI应用生态系统”,它可以直接帮用户打车、安排日程,调用各种服务接口、调用各种大模型能力,这会削弱苹果App Store的地位,用户可能不再需要通过下载App来获取服务了。
苹果应用商店的年销售额约为240亿美元,这对苹果来说无疑是一个“动家底”的大事。
除了担心应用商店的大蛋糕被动,苹果另一大担忧是,如果不能开发出自己的AI系统,跟其他竞争对手的产品相比,iPhone可能会失去竞争力,变成一块“笨砖头(dumb brickr)”。
目前iPhone的年销售额超过了2000亿美元,苹果一家独占全球智能手机市场85%的利润,iPhone,是苹果的根基所在。
七、内部调整聚焦AI,人才仍是苹果AI的“短板”
AI掉队的这种紧迫感让苹果这一年多以来动作频频,比如此前苹果取消了耗资百亿美元的自动驾驶汽车项目,将原项目中的数百名工程师转移至AI研发团队。
据两位知情人士透露,苹果还在探索和开发使用iPhone和Mac芯片的服务器,简单来说,苹果要用自己的自研芯片做自己的AI服务器,把A系列芯片和M系列芯片用在服务器里,让未来产品所用到的云端AI功能跑在真正“可以被苹果掌控”的服务器上。
这样一来,苹果终端产品和云端服务器从硬件芯片层面来说也可以有更好的一致性。
当然,这样做也可以帮苹果省下一大笔钱。
据彭博社报道,此前苹果发布的M2 Ultra或成为苹果首个AI服务器芯片。
虽然苹果目前的节奏有些慢了,但苹果做AI的优势还是很明显的,首先,苹果在全球有20多亿部iPhone,苹果可以将新的AI产品应用在这些设备上。
同时,苹果有着强大的芯片团队,他们可以为AI功能解决算力之忧。
据报道,苹果在过去的十年里,一直在努力开发AI相关技术,建立自己的“全面的AI战略”,但Siri从发布以来就没有什么重大进展。
John Burkey曾经为苹果Siri工作了两年,离开苹果后他创立了一个生成式AI公司Brighten.ai,他说,Siri团队没有获得苹果内部其他团队所获得的那种关注和资源。“这不是苹果的基因,这是一个盲点。”Burkey说道。
多年来,苹果一直在招揽AI方面的人才,收购AI领域的高价值创企,但苹果同样面临着非常严重的AI人才流失问题。
据报道,AI人才离开的一个重要原因可能是苹果过于严格的保密措施,苹果在AI方面发表的论文要远少于谷歌、Meta、微软等公司,2020年离开苹果重返卡内基梅隆大学的顶尖AI研究员Ruslan Salakhutdinov就表达了自己当时渴望重回学术界的想法,他希望去一个研究所,去一个更“Open”的地方工作。
虽然最近几个月苹果发表的AI相关论文略有增加,但一些AI领域的大佬对这些论文的价值提出了质疑,认为这些论文更多是一些“面子工程”,而不是真正可以让苹果落地在产品中的研究。
结语:软硬件生态并行,苹果AI大招蓄势待发
从各路爆料信息来看,苹果Siri的一系列重磅生成式AI升级、iOS 18中即将加入的各类生成式AI功能,以及苹果与OpenAI、谷歌等公司的密切商谈,都表明了苹果对AI的重视,并且我们能够看到苹果做AI是多线出击、全方位布局,从软件、硬件、操作系统到三方合作,苹果都在紧锣密鼓做着准备。
Siri多年来的“不瘟不火”,或许即将成为历史,苹果将与谷歌、亚马逊等科技巨头一样,用大模型重塑智能语音助手。
接下来,苹果将在6月的WWDC上交出一份怎样的答卷,不仅关乎苹果自身AI及整个业务盘的发展,更关系到整个消费电子产业后续如何应用AI,很多企业都在以苹果为标杆。
当然,国内不少智能手机领域的头部玩家都已经行动多时,各类生成式AI功能早已落地,后来者苹果能否真正带来一些改变行业的新玩法,值得期待。