5月16日,针对网传华为大模型文生图现场疑似人工调取预置图片的消息,华为昇腾社区回应称,现场图片为实时生成,调用的是开源大模型,并非调取预置图片。
事件起源于5月10日的鲲鹏昇腾开发者大会,当时在一场面向开发者的技术讨论会上,华为演示了mxRAG SDK功能,展示如何通过十几行代码即可完成RAG应用开发。
网传视频及聊天截图显示,华为在演示文生图功能时,按下Crtl-C中断,显示对应代码为time.sleep(6)。有网友解读称,代码的意思是暂停6秒,然后调取预置图片展示出来。
此消息一出,立刻引发网友对技术能力真实性的讨论。有部分观点质疑,这是华为大模型能力演示造假,指责华为利用time.sleep(6)来模拟生成,实际是人工调取预置图片。
网传鲲鹏昇腾开发者大会现场图片
针对网络上的质疑,昇腾社区回应称,现场图片为实时生成,调用的是开源大模型。代码中有time.sleep(6)等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。
根据公开资料,mxRAG的功能为检索(Retrieval)、增强(Augmentation)和生成(Generation)。这一能力是目前开发大语言模型(LLM)所需的重要能力之一。
一些学术资料显示,LLM+RAG被应用于包问答系统、聊天机器人、事实验证、金融领域的决策支持等多个领域,未来还可以提高模型的可信度,开发多语言和多模态的RA-LLMs等。
尽管华为已公开回应,对于此次事件,网上多种观点仍在辩论。
华为昇腾社区官网截图
一些行业人士认为,time.sleep(6)可能是为了确保程序在演示过程中不会出现意外情况,而预设的一个缓冲步骤。这样的做法在技术演示中并不少见,目的是为了展示过程的平稳和可控。
也有专家指出,大模型的计算和生成过程确实需要时间,而time.sleep(6)可能是为了展示模型计算的实际耗时。在AI领域,模型的计算速度是衡量技术先进性的重要指标之一。
但同时也有开发者认为,文生图过程理论上“完全没必要sleep(6)”。
截止目前,华为此次展示的mxRAG SDK功能,还未在开发者资源下载中心上线。而由于昇腾社区暂未公布源代码,开发者目前也仅能通过网传代码截图进行经验判断和讨论。
本文系观察者网独家稿件,未经授权,不得转载。