文|林炜鑫
编辑|邓咏仪
五个月前,科大讯飞正式推出讯飞星火大模型,董事长刘庆峰现场立下升级flag:10月24日,星火大模型“要在中文上超越ChatGPT,在英文上达到跟它相当的水平”。
如今,开篇的flag到了要兑现的时候。
在合肥,第六届世界声博会暨2023全球1024开发者节开幕,科大讯飞发布了星火认知大模型3.0(以下简称“星火3.0”)。在演讲开头,刘庆峰略带激动地表示:
“星火大模型3.0整体超越ChatGPT,医疗领域超越GPT-4。”
刘庆峰也引用了国研经济研究院评测报告, 指星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平,在医疗、法律、教育行业的表现格外突出。
不仅如此,下一代大模型也正在路上。刘庆峰透露,对标GPT-4的更大参数规模的星火大模型已正式启动训练,预计2024年上半年将实现对标GPT-4。
但一个现实是,通用大模型投入巨大,目前对科技公司而言,商业压力已有所显现。10月24日发布会举办的同时,科大讯飞股价触及跌停,市值一日蒸发逾119亿元。截止收盘,虽有小幅反弹,但较今年6月的高点,已经跌去逾42%。
上市公司的财务压力也是另一方面。2023年Q3,讯飞营收同比增长2.89%,至47.72亿元,但归母净利润同比下降81.86%,此前讯飞曾对外表示,这主要是由于大模型还在投入期。
发布会现场
星火3.0能做什么?
首先从底层模型来看,星火3.0在知识问答、文本理解、数学计算、多模态等七大能力上继续提升。
在发布会现场,讯飞研究院院长刘聪实测了多项大模型功能。
一个小细节是,刘聪全程都用语音与星火3.0对话。在有声绘本创作环节,他通过四次提问,与大模型一同绘制了四页的儿童有声绘本,以此体现星火3.0对prompt的理解更深入,并且在细节表达上更丰富。
此外,星火3.0新增了虚拟人格功能,可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。
刘聪把星火3.0设置为“诸葛亮”,以“刘备”的口吻和星火对话,请教“诸葛亮”如何用大模型来一统三国。“诸葛亮”则冷冷说了句,主公切勿耽误国事。
讯飞还上线了虚拟人格应用“星火友伴”,允许用户自定义任何虚拟角色,并与之对话。刘庆峰表示,该功能发布仅48小时,后台便收集到超过3000个“友伴”。
科大讯飞董事长刘庆峰
这还只是发布会的前菜。如今通用大模型琳琅满目,市场的目光更多开始转向应用层。在本次发布会上,讯飞也推出了多款教育、医疗领域的AI应用。
AI英语答疑辅学:AI启发式教学
通用人工智能时代,AI技术有可能改善教育资源不均等问题。
讯飞对教育关注并投入多年,给出的解法是,类人式对话辅导,进行逐层讲解。
发布会上,在星火3.0加持下,讯飞AI学习机首次发布了启发互动式英语AI答疑辅学功能,实现个性化解决、启发引导式提问、互动探究式学习等功能。
刘聪在现场就一道英文选择题,对AI学习机多轮提问,无论是探讨语法对错还是理解文章主旨,AI学习机都能自如回答。
发布会现场
讯飞AI学习机还搭载了科普大模型,背后则是讯飞与科普中国、少年儿童出版社的合作。现在,中小学生可以在学习机上轻松获得海量科普资源。
不过,近日网上有消息称,讯飞学习机里出现不当内容。刘庆峰今日面对媒体表示,该事件发生在10月16号,爆料人是科大讯飞的一个合作伙伴,相关内容则是在审核时遭到供应商提前试用。公司发现问题后第一时间下架了相关内容,并对涉事供应商做了处罚,也在内部做了处分。
刘庆峰说,未来对学习机内容的审核会更加严格。同时,讯飞已经报案。
讯飞晓医:AI覆盖看病前、用药时、日常健康管理
医疗则是讯飞擅长的另一大领域。本次发布会,“讯飞晓医”APP出现在人们视野。
看病之前不知道怎么准确表达自己的病情?自己买药不知道有何禁忌?拿到体检报告后想马上“识别”出自己去年和今年比有什么健康异动?
任何关于看病的问题,都可以问一问讯飞晓医。
讯飞晓医主要的场景是线上问诊、用药咨询、体检报告解读等,背后则是讯飞星火医疗大模型的核心能力支撑。
其实,讯飞AI很早就在医疗领域有过探索。2017年,讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,致力于给基层医院及等级医院的医生提供诊疗辅助。
但医疗是个相对严肃、容错度很低的领域。讯飞直到今天才推出医疗大模型,可见其谨慎程度。据介绍,该大模型已经通过信通院和国家卫健委医疗健康大模型标准规范评测。
刘庆峰说,第三方测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。
发布会现场
星火科研助手:快速读论文,还能帮忙英文润色
在科研领域,讯飞与中科院文献情报中心合作研发科研文献大模型,并且打造了星火科研助手。该产品主要有三大基础功能:成果调研、论文研读和学术写作。
刘聪现场实测,用科技文献大模型将十几份量子计算论文一键生成综述报告,为科研人员快速了解最新论文大幅提效。
论文写作时,星火科研助手不仅提供学术翻译,还能帮忙英文润色,使论文的英文表述更加native。
“以人工智能领域为例,每天有84篇文章发表,每篇阅读10分钟,一天读完也要花14个小时,”刘庆峰说,“科技文献大模型快速生成综述,对科研人员快速掌握全球最新前沿进展有巨大帮助。”
AI心理伙伴:无法跟人说的事,找AI倾诉
AI能力的进步,也开始覆盖到青少年的心理健康问题。
讯飞推出了基于星火3.0打造的AI心理伙伴。该产品具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力。
技术人员给产品背后的模型“喂”了10亿+条心理类数据、40万+篇期刊文献、100万+通脱敏心理对话案例、550万+个心理评估数据。
于是,AI心理伙伴“小星”不仅能“听懂”孩子的心事,还能主动回应,给出个性化的建议。与孩子对话接受后,“小星”可以第一时间生成心理咨询报告,同时将预警信息发给心理老师。
至今,该产品已覆盖3202所学校,服务259万中小学生。
大模型再好,真的落地了才行
大模型风靡至今,ChatGPT等概念已经完成了对大多数人的普及。但如果问你,如今有什么行业在用大模型?
答案似乎很难脱口而出。
对所有大模型玩家而言,找到合适的商业场景,也是当下最要紧的任务。
一口气掏出12个行业大模型
在发布会上,讯飞联合行业龙头,一口气发布了12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律、科技文献、政务、传媒、文旅、水利等领域。
发布会现场
拿工业领域来说,基于讯飞星火的羚羊工业大模型于9月20日正式发布,通用人工智能成为新型工业化的核心引擎。
不到一个月时间,羚羊工业互联网平台的用户总量提升59%,平台服务企业次数增加88%。
国产算力的重要性不言而喻
在发布会亮相的,还有一个国产算力平台。
此次,讯飞联合华为,正式推出基于昇腾生态的“飞星一号”大模型算力平台。
发布会现场
刘庆峰说,“我很自豪,星火大模型靠的是自主可控的国产算力。”
他透露,讯飞和华为很早就成立了“联合特战队”,半年内加班加点,实现了星火大模型训练和推理效率均翻番。
考虑到美国在算力层面的进一步限制,大模型转向国产算力是大势所趋。讯飞在国产算力上的布局与合作,某种程度上,为大模型的研发上了份“保险”。
写代码变得更容易了
1024是程序员的节日。大模型给予程序员的一个实在的便利是,写代码更容易了。
此前,星火2.0已经提升了代码能力,通过iFlyCode这款AI智能编程工具,让不懂编程的小白也可以快速生成简易应用。
本次发布的智能编程助手iFlyCode2.0,搭载了星火3.0,在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%。
iFlyCode发布以来,已在京东云、软通动力等107家机构实现深度对接应用。
发布会现场
从开发者数量来看,5月6日星火1.0发布后,讯飞开放平台新增143.4万开发者团队,同比增幅331%,并且汇聚了553万AI生态开发者团队。而另外的1.5万助手开发者(不懂编程的小白),则开发出了超2.9万个助手应用。
欢迎交流