衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
在病休近6个月后,王慧文突然有了新动作,再次与袁进辉牵手:
入股其创业新公司硅动科技。
企查查公开资料显示,就在这两日,北京硅动科技有限公司(以下简称硅动科技)发生工商变更,新增王慧文为股东。同时,注册资本由100万人民币增至约105.26万人民币。
也就是说,王慧文目前在袁进辉新公司的持股比例约为5%。
OneFlow二次创业:硅动科技
硅动科技,成立于今年8月。
目前,该公司法人、执行董事、经理均为OneFlow创始人袁进辉。
公司经营范围含软件开发、技术进出口、电子产品销售、人工智能应用软件开发、人工智能通用应用系统、人工智能行业应用系统集成服务等。
简单回顾一下,OneFlow是国内知名开源深度学习框架及开发平台。
其团队上次创业一流科技时,由王慧文的光年之外收购其46.52%股权。
不过,随着6月底光年之外创始人王慧文病退消息曝光,美团收购光年之外100%的权益,一流科技OneFlow团队作为其核心资产也转归美团名下。
再50天后,袁进辉宣布带领OneFlow原班人马再次创业。消息传出后不到半个月,硅动科技注册成功。
早些时候,袁进辉在朋友圈发布,重新创业的计划目标是瞄准大模型推理成本问题。
计划第一个推出的产品是大模型推理和部署系统,解决AIGC和LLM行业推理部署成本太高的痛点,我们判断这是大模型时代最好的商业机会之一。
顺着这个目标,硅动科技还是悄悄进行了一些动作。
譬如今年9月,团队工作《Coop: Memory is not a Commodity》被NeurlPS 2023接收。
论文提出了一种名为Coop的方法,旨在解决在有限内存预算下,训练大型动态深度神经网络(DNN)的挑战。
而且量子位整理发现,除了面向大语言模型外,袁进辉团队最近还在Stable Diffusion等AI绘图模型上进行测试。
最近,AI infra公司都咋样了?
袁进辉是知名AI架构大牛(网名“老师木”),博士毕业于清华计算机系,师从中国人工智能奠基者、院士张钹。
他带领的Oneflow一次创业之时,业界还没有明确的“大模型”概念。
当时以卷积神经网络架构的视觉模型为主,高效训练更大的模型是袁进辉看好的方向。
如今团队二次创业,国内外开闭源大模型生态繁荣,模型参数愈来愈大,成本高到难以计数。
袁进辉率团队转而瞄准AI推理成本问题,也是很自然的选择。
当然了,无论AI训练还是推理,可归属一个更大的概念之下,AI infra(AI基础设施)。
除了袁进辉外,近两年——尤其是大模型遍地开花后,AI大模型的产业链和生态更加成熟,许多公司都把目标放在了这一层面上。
如潞晨科技,在大模型系统开源社区一直非常活跃。
团队提供开箱可用的8到512卡LLaMA-2训练、微调、推理方案,还采用高效训练方法,用约8.5B token 数据、15 小时、数千元的训练成本,构建了中文LLaMA-2。
又如阿里前VP贾扬清的创业公司Lepton AI,在官网宣称从一行代码开始,借助云原生平台,在几分钟内高效、大规模地运行AI应用。
11月底,该公司发布了开源项目,用AI加工emoji。
好了,说回今天的主角硅动科技。
由于袁进辉自身履历、团队既往成绩以及与光年之外的故事,这家公司虽然暂时还没有对外正式宣布自己项目的新进展,但毫无疑问,该公司是AI infra层创业团队里,格外瞩目的一支。
而且,老王的再出手,似乎也说明了他对整个团队的看好和信任——无论是能力还是方向。
不知道接下来,硅动科技会拿出什么样的成绩单?
参考链接:
[1]https://www.qcc.com/firm/3ffcf2c32b35c6ef4bdb06fc594c45cd.html
[2]https://m.okjike.com/originalPosts/65672990c9ed8caff0eeb600?s=ewoidSI6ICI2NDczZGIzYTM2YmI3ZGRlN2IyYzY5ZmYiCn0%3D&utm_source=wechat_session
[3]https://twitter.com/yadong_xie/status/1730047407180906661