几天后的中国公司们将迎来英伟达的缩水 AI 芯片 H20、L20 PCle 和 L2 PCle。当中性能最好的 H20,理论综合算力差不多是旧旗舰 H100 的 20%。
几个月后的全球其他公司也将迎来英伟达的新旗舰 HGX H200。由于搭载更快的内存,H200 内存容量几乎翻倍、内存带宽增加 2.4 倍,使其比上一代产品 H100,在 Llama 2(700 亿参数)上的推理速度快了几乎一倍,INT8 张量核心下提供的每秒浮点运算次数达到 3958 万亿次,同样是上一代的两倍。
在充满危机意识的英伟达创始人黄仁勋眼中,速度意味着一切,他不满足于 “摩尔定律” 每 18 个月性能翻一番,提出了比之快 3 倍的 “黄氏定律”,还喜欢在各个场合强调要奔跑。
当 H100 老客户抱怨买不到更多显卡、准客户抱怨连 H100 都没入库的时候,H200 就这么来了。紧俏的供需关系让官方售价 3.5 万美元的 H100 已经成为 AI 圈子里最硬的通货,而英伟达从中赚走九成以上利润。
今年上半年,英伟达的毛利率差不多赶上卖奢侈品的 LVMH,净利率接近其两倍。就连集成供应商对下游的话语权也大得惊人。A 股上市公司汇纳科技 11 月 14 日宣布其内嵌英伟达 A100 的算力服务收费翻倍。
英伟达的最大客户们也都成为了其竞争对手。媒体报道称微软即将在本周的年度开发者大会上推出首款自研 AI 芯片;Google 和亚马逊一边投资 AI 初创公司,一边要求对方承诺用自己的 AI 芯片和服务器;就连 OpenAI 都有研发 AI 芯片的打算。
这也是为什么上周参加一场媒体活动时,已经垄断 AI 芯片九成生意、坐拥万亿美元市值公司的黄仁勋说,没有一家公司可以确保生存,英伟达仍处于危险之中。
今年 5 月底在台湾大学演讲时,他鼓励毕业生们不管前方是什么,“像我们一样追上去。向前跑,不要走……你要么在寻找食物,要么在避免成为食物。很多时候,你无法分辨是哪种情况。但不管怎样,都要向前奔跑”。
14 年前接受《东方卫视》专访时,主持人问他,为什么每 6 个月更新一次产品那么重要,黄仁勋答:“因为别人做不出来……技术会更新很快,谁最快一定会赢……我们的跑道足够长、足够蜿蜒,跑得快是最佳策略。”
此前为了显示自家 TPU 芯片有多出色,Google 发明了 AI 芯片的性能测试标准 MLPerf。英伟达的副总裁 Marc Hamilton 称,黄仁勋想让 Google 的人每一次运行 MLPerf 都发现,英伟达的 GPU 更快一点。(邱豪)