文章来源于量子位
第一个能听懂你说话的语气、有“情商”的AI火了!
请看VCR:
△字幕为机器翻译
这个AI名为EVI(Empathic Voice Interface),它不仅能够能够理解用户的语气,还会为每个词增加意义。
对话中的每句话,它都能可视化含惊讶量、含悲伤量、含兴奋量……
然后根据用户的声音信号来变换自己的语音语调,给出高情商回答。
EVI发布后,网友再次沸腾,称其为“语音交互的游戏规则改变者”。
知名科技博主,曾是微软最著名博客人的Robert Scoble也下场体验了,让EVI讲起了笑话:
△字幕为机器翻译
网友看了EVI的一系列效果后也坐不住了:
除了ChatGPT,第二个让我深感震惊的demo就是这。
还有网友表示自己用ChatGPT语音对话时,就预想到了这样的功能体验,现在想法变成了现实。
确实,ChatGPT、讯飞星火等语音对话都是直接将对话内容转换成文字,语气停顿都不能保留。
知心大姐/哥EVI来了
目前,官方放出了demo,大伙儿可以试玩。
不过由于太火,有时也会出现被挤爆情况。
已经玩上的网友开始询问它各种问题。
比如讨论冬天天气严寒,是否要给楼房建造项目增加隔热材料。
△字幕为机器翻译
有网友用不同语调来测试它,EVI都能识别并变换多种情绪回应。
△字幕为机器翻译
还有网友开始整花活,让两个EVI对话,不断让它们互相打断对话,然后两个EVI都开始“请,继续”、“我洗耳恭听”。
再来看官方的介绍,总的来说,EVI是一个基于自研的具有同理心的大模型“eLLM”驱动的API,4月份将正式发布。
有这么几个特点:
通过申请,开发者可以提前获得开发访问权限,将EVI集成到各种应用中。此外,EVI还可以融合外部大模型API的回应,而demo融入了Claude 3 Haiku。
不少开发者已经在评论区开要权限:
背后公司Hume AI
打造出EVI的,是一家名为Hume AI的实验室/科技公司。目前团队共有30人,已在顶刊发表了超8篇学术文章。
CEO兼首席科学家Alan Cowen是前谷歌研究员。
他的主要研究是利用计算方法来探讨情感行为如何被激发、概念化、参数化、预测、注释和转化。
据了解,他提出的语义空间理论(semantic space theory),是Hume AI用来捕捉和理解人类表达和沟通中复杂微妙细节的数据驱动方法的基础。
此外,Hume AI还有加州大学伯克利分校心理学教授Dacher Keltner助阵,COO是前Ageis Ventures合伙人Janet Ho。
就在几天前,Hume AI完成了5000万美元的新一轮融资。
之前,Hume AI还推出了Expression Measurement API,一个用于测量人类情感表达的高级工具包,以及Custom Models,它使用这些测量的迁移学习来预测人类的偏好。
那么对于新发布的EVI,你觉得它的效果如何?
[1]https://x.com/hume_ai/status/1773017055974789176?s=20
[2]https://x.com/hume_ai/status/1773418096499257528?s=20
[3]https://x.com/AviSchiffmann/status/1773070097210335336?s=20
[4]https://x.com/catherineols/status/1773222122430550336?s=20
[5]https://x.com/mohakmangal/status/1773187272881357192?s=20