从包小柏“复活”病逝的女儿,到网友用AI“复活”李玟,AI“复生”成为时下最热门的话题之一。
电商平台的商家早已嗅到商机,用AI“复活”亲人的小店和工作室一搜比比皆是,最低10元就可以“让老照片动起来”,有的商家界面显示“动起来不说话”40元,“制作说话”150元,界面显示已销售800多份。
不过,在数字人领域深耕多年的头部企业却显得冷静。硅基智能过去几年间“复生”了几千人,创始人兼CEO司马华鹏对第一财经表示,整个企业过去克隆了约50万个数字人,这意味着在整个大的市场里,数字永生业务只占到一小部分,“不是大家看上去那么美好的一个产业。”
“很多人不愿意把亲人‘复制’出来,有些带来的是快乐,有些是走了就走了,再反复看反复沟通,会加深痛苦,你知道吗?”司马华鹏谈及,在探索AI“复生”的项目上,硅基智能团队也曾经历不少拒绝,在他看来,在国内数字永生可能是一个天花板不高的产业,但数字人领域,无论是短视频、直播,还是大模型加持下的互动应用,都有很大的想象空间。
从几万到低至10元
数字永生这一概念最初被大众所认知,是在2023年初上映的《流浪地球2》,其中刘德华饰演的科学家图恒宇企图让女儿延续数字生命,通过将女儿的记忆、情感、性格、思维方式等资料上传至超级计算机,形成了有自主独立意识体的数字生命形态。
“AI复生的概念,从这个电影就有了。”神马工场创始人马建军对第一财经记者表示,永生也是人类这么多年一直追求的梦想,因此在数字人技术成熟之后,大家就开始慢慢探索数字永生。
神马工场是AIGC数字人平台企业,马建军提到,也是在做数字人业务的过程,很多客户提出,这种场景也能够容纳一些数字生命的需求,在市场需求推动下神马工场开始去尝试。
对于AI“复生”最近爆火的原因,司马华鹏认为,去年到今年一个非常大的爆发点在于大模型技术的成熟,“去年前年大家做的是数字孪生阶段,把人的声音形象克隆出来,但是今年因为有大模型技术的加入,已经可以沟通和聊天了。”
“到今天来看,这个树上为什么结果,因为它是长了好多年的树,那么它一定会到这个点成熟,”司马华鹏比喻道,“所以行业本身一个是大模型技术成熟,一个是数字孪生技术成熟,加起来就带来数字永生大量涌现的现象。”
硅基智能成立于2017年,“AI复生”相关业务属于公司“数字永生”的板块,目前已经形成了标准化的产品线。在硅基智能一开始做数字人时,行业成本还是几万元甚至数十万元一个,但现在已经下降至几百甚至几十元一个。
硅基智能第一个数字复生案例是在2018年,当时一位联合创始人的母亲离世,为了弥补遗憾,联合创始人提出意愿,硅基智能开始探索用AI技术‘复活’其母亲,做了一些尝试,“到后面这个项目越做越好,就从实验室的项目变成了一个标准化的产品。”司马华鹏表示。
在2018年做数字人时,行业的主流路径还是依托计算机图形学技术以及真人动作捕捉,需要采集大量的真人数据,深度建模,成本高昂。到了2020年以后,司马华鹏发现,AI生成的数字人效果已经不错,且口型非常真实,之后硅基智能开始以 AI生成技术为主来做数字人。
“大概提供一张你的照片或者几十秒的视频,我们就能把你‘克隆’出来,这个事情已经整个实现了,且成本很低。”司马华鹏表示,现在已经便宜到几百元就能做一个数字人,甚至送一个带硬件的数字人也才几千元。对于电商平台有低至10元一个的数字人,他认为,其质量和效果区别还是比较大的。
在保持效果的情况下,神马工场去年推出了成本在千元以内的数字人,“现在很多公司是基于开源技术复制出来的数字人,但数字人成型决定数字人的效果,如果做不到90分的相似度,看上去就没法用,像我们做的都得到95%至99%的匹配度,逼真度要非常高,效果就好很多。”
据司马华鹏的介绍,一个人数字人快的话几十分钟就能做出来,但在“复活”的过程中,最关键的是资料数据,根据资料的多少,“复活”对应的难度和要素差别也较大,“有的人就发了一些连正脸都看不清楚的照片,‘复活’就变得非常被动。”
马建军认为,要实现“复生”,一方面是要提供三到五分钟的视频素材片段,其次是声纹,有几分钟最好,需要吐字清晰,这是基本的形象和声音的克隆。但第三点也是现今最难的部分,是大脑的复制克隆。
“在形象、声音的基础上,加上人的大脑、意识形态的复刻之后,才能真正意义上实现数字永生。”马建军表示,这也是神马工场未来的探索、研发方向。
不一定是好生意
“很多人会觉得数字永生是一个很大的市场,但因为我们做了时间比较长,会发现很多人是不愿意把亲人克隆、复制出来的,有些带来的是快乐,有些带来的不一定是快乐,有可能会加深一些痛苦。”在AI“复生”大热的当下,司马华鹏提供了一个稍显冷静的从业者视角。
从2018年开始探索数字“复生”,一步一步走到今天,司马华鹏感慨,团队对于数字永生的现实落地的认知也在教育中提升,“我们这么多年做过很多的产品和项目,最怕的项目就是那种看上去很好,但实际上并不能构成刚需性需求的一些产品,这很容易掉到一个‘自嗨’的陷阱里。”
“(数字永生)不是我们想象那么好或者那么大的一个利基市场,有些人走了就走了,有些人可能还是放不下,那也有很多种纪念方式,数字生命是其中一种。”司马华鹏说。
在国内推进数字永生,也面临着不少的阻力,一方面是大众对于新事物的接受度不高,另一方面是很多伦理、文化的问题,司马华鹏提到,“中国人只是在清明节这种特定的时候祭奠亲人,但是平时要天天这样沟通的话,带来的心理损伤可能也比较大。”
马建军认为,数字永生整个市场现在还不够成熟,也不够大,一方面是素材少,其次是意识形态复刻技术门槛比较高。“大部分时候,复刻一个已故的人,尤其年纪比较大的逝者,基本没有什么清晰的影像,或者口播效果的视频,这样就很难去做复刻,第二是知识库、意识形态方面,大部分非公众人物,逝者的观点留存也会很少。”在他看来,这是现在整个市场没爆发的原因之一。
数字永生也正面临着法律和伦理的问题,最近一段时间AI“复活”明星也引起了不少的争议,遭到家属的反对。我国《民法典》第1019条规定,任何组织或者个人,未经肖像权人同意,不得利用信息技术手段伪造等方式侵害他人的肖像权;第994条规定,死者的肖像等受到侵害的,其配偶、子女、父母有权依法请求行为人承担民事责任。
上海大邦律师事务所高级合伙人游云庭认为,从严格的法律意义上来说,一个公民的肖像权、姓名权、声音权都是受法律保护的,哪怕去世后,行使这样一些权利也应该取得其继承人的许可。
“但是公众人物有一定的特殊性,因为有很多粉丝,这些粉丝或者是熟悉本人的人,如果看到这样一些公众人物的视频是缅怀的,哪怕是人工智能创作的,相信绝大多数粉丝不会有意见。”游云庭表示,如果对社会来说是一个无伤大雅的行为也没问题,但如果家属或者其继承人对此提出了异议,就应该尊重其意见,将一些内容下架。
从AI技术的伦理边界来看,游云庭认为,AI“复生”的前提,一是对社会来说不会造成一些混乱或错误的认知,不能给社会现行的秩序造成冲击,其次对逝者的家人来说,不会造成情感上的伤害,这是非常重要的两个维度。“这是一个新生事物,但是它可能也是会给社会带来比较大冲击的新生事物,所以它在前期会是一个低调的探索阶段。”
在从业者看来,数字永生或许是一个较容易看到天花板的市场,但数字人技术本身的市场想象力还很大。
马建军介绍,数字人主要有三大应用场景,一是视频,第二是直播,第三是互动,包括社交、数字生命等领域。神马工场一开始做短视频起家,目前其八成的应用场景还是在短视频行业,也做了不少的直播探索。不过,在未来,马建军表示研发方向也会开始集中在互动场景,包括数字生命、大脑复刻。
AI数字人短视频、直播也是硅基智能探索已久的场景,司马华鹏表示,在这些方面公司已经形成了一个非常成熟的产业,在未来,硅基智能会开始探索AI拍剧、AI互动等领域。
利用现有的大模型技术,硅基智能正在探索做虚拟伴侣这样的ToC应用,“中国人对于亲情方面的表达很多时候是比较含蓄的,但如果是男女朋友,在当下的社会情境中可能需求会更高。”司马华鹏说。