是时候不让AI PC被算力束缚了

新闻资讯2024-04-29 17:57:38橙橘网

是时候不让AI PC被算力束缚了


作者 | 六九的小号
邮箱 | liuzy@pingwest.com

无论你出于什么原因看过去年被热议的电影《芭比》,那么你一定对下面这个经典转场有印象:


但你可不要被画面下方的提示“insert coin”误导,以为电影《芭比》被改编成了需要投币的街机游戏。这是一个经过AI转绘的作品,AbleSlide 联合创始人、Blender 艺术家、AI创作者Simon阿文将《芭比》电影中的经典过场,通过AI的方式转绘为像素风,还原出复古16bit游戏的经典美术风格。

Simon阿文表示:“‘AI 如何塑造我们的工作与生活’ 这个在过去听起来是少数大公司才有资格讨论的问题,但在如今这个问题的答案由AI社区和创作者塑造。包括央视春晚AI动画等作品在内,从文字、图像到影像,我的许多探索是基于本地GeForce RTX 4090 完成的。AIGC的可能性是一片蓝海,AI PC是我的帆船。”

实际上,随着图像、建筑、音乐等专业领域的产品与应用陆续落地,AI PC的形象也正逐渐清晰,并开始悄悄改变我们熟知的生产力形态。

在最近一次 RTX AI 媒体品鉴会上,NVIDIA向我们展示大量与AI相关的技术Demo,不仅有来自底层硬件厂商视角的观点分享,也带来了各种实机的Demo体验。对于“AI PC具体是如何带来生产力革命的?”“AI PC如何在本地获得充沛的算力支持?”等问题,我们尝试着在这次活动中寻找答案。

1

AI PC + RTX 40系 GPU,生产力呼啸而来

尽管早已在眼花缭乱的AI新闻中浸淫多年,但当我看到NVIDIA这次展出的技术Demo,应用层生成式AI发展的速度之快,可以说大大超出了我的预料。

要知道,此前虽然我们已经可以自由使用各种AIGC生成工具,但往往都是凑个热闹的“玩具”属性,离高效可控的实用生产力依然有一定的距离。而在NVIDIA RTX技术的支持下,已经有越来越多成熟的工作流Demo被构建,其成果甚至已经进入商用领域。此次NVIDIA就带来了大量优秀成果。

在RTX AI品鉴会现场,对于NVIDIA这样的头部芯片厂商来说,其代表性技术几乎都需要通过合作伙伴的产品搭载来实现,所以本文介绍的这些活动现场的技术Demo演示都是通过AIC与OEM的产品来展示,其中现场用来展示部分AI Demo的几台搭载RTX 40系笔记本电脑GPU的联想拯救者吸引了我们的注意。


首先是这台联想拯救者Y9000P至尊版,其正在展示AI证件照Demo,稍后我们会介绍到。搭载RTX 4090笔记本电脑GPU,支持175W性能释放,同时配备了更豪华的大面积VC均热板,CPU部分加入了液金导热,双烤功耗进一步提升到最高250W。因此在 3D MARK跑分(DX12)能达到21883,这也就意味着,市面上那些3A大作或者是复杂图形渲染,这台笔记本电脑都可以轻松搞定。

另外,这块屏幕的显示效果非常出色,一块16:10黄金显示比例的16英寸面板,拥有2560×1600像素分辨率,100% DCI-P3高色域,240Hz刷新率,500nits亮度,3ms响应时间,还支持画面防撕裂技术、杜比视界,DC调光、防蓝光护眼和X-Rite出厂校色等等。这意味着,这块屏幕可以完全满足专业创作者对画面的高标准要求。


而这台白色的Y9000X 2024上展示了来自数字艺术家 & 策展人土豆人Tudou_man 的AIGC作品,他通过AI把晚霞做成了毛绒绒的围巾,挂在了武康大楼、外滩钟楼还有和平饭店上,圣诞的氛围拉满。

这台联想拯救者 Y9000X 2024搭载了 GeForce RTX 4070笔记本电脑GPU,延续了精湛的CNC一体精雕工艺,全金属机身,ACD面还采用了AED电泳白工艺,视觉上显得更加简约干净,辨识度爆表。最薄处做到了17.6mm。

活动现场第一个给我带来深刻印象的Demo就是:开发者基于Stable Diffusion和人像生成控制模型InstantID,建立起的AI证件照生成工作流Demo。

即便你身穿睡衣、加了一晚上班满眼黑眼圈,只要打开前置摄像头拍一张照片,就可以生成一张精精神神的证件照。不仅画面纯净通透,光影变化明暗自然,还对人像进行了恰到好处的美颜并达到影棚级别的水准。


立等可取的高质量AI证件照

由于这套工作流对算力与显存都有着更高的要求,最低也要16G显存,因此活动现场的Demo是运行在了一台搭载了GeForce RTX 4090笔记本电脑GPU性能强劲的联想拯救者Y9000P至尊版上。

当然,光是高水准的出图还不够,为了提升效率,现场还演示了市面上最快的Stable Diffusion 计算出图方案——在GeForce RTX 4090 D桌面端GPU上开箱即可享受到高达每秒8张图的生成速度。什么概念?要知道笔者用自己两年前配的电脑跑Stable Diffusion文生图的时候,平均几乎要30秒才能生成一张图,看到这我当场想换显卡。


此图没有加速处理,一秒八张的图片加特林

这还没完,若是使用NVIDIA TensorRT,并配合开发者进行性能优化,采用GeForce RTX 4090 D的台式AI PC最高甚至可以实现每秒超过百张图的生成速度。这不仅仅是速度快的问题,不妨开一下脑洞:要知道比较普遍的视频和游戏画面帧数也才不过60fps,设想一下每秒100帧实时生成的画面,足以一定程度颠覆传统视频和游戏的消费逻辑。

另一个实用的技术Demo演示来自于前沿建筑设计师、艾哎集瑟科技联合创始人言萧。在演示过程中,只需要在绘画区按照自己的意愿勾勒几笔,一张兼具设计者表达与实际效果的建筑渲染图就出现了。创作者还可以根据现有图片快速调整,效果极佳。


随画即可见的建筑渲染

这对于设计师的工作辅助是非常大的:过往的设计提报往往需要设计师花时间手绘,再约时间开会决定方案,流程相对漫长。但在这样实时生成的渲染图的辅助下,设计师可以在会议中即时作图,确定方向以后再逐步细化,大大加速了推进效率。据说,这里使用的建筑大模型全网下载量超50W,在专业领域已经逐渐开始创造商业价值。

当然,我们对AI PC的期望不光是生产力效率革命,还有使用者的个性化需求,这里的个性化肯定不是用Stable Diffusion画小姐姐,而是指将来的AI PC作为“私人助理”这个角色存在时,为PC用户提供更为私密、个人化的定制服务。

而在活动中ChatRTX的技术Demo演示,基本可以看做AI PC个性化模型的雏形:活动演示中ChatRTX搭载的是智谱AI的ChatGLM3-6B模型,可以读取用户的本地文件,筛选出最符合用户描述的图片,并生成文件夹用以下一步操作。


导入文件夹,ChatRTX就可以帮你挑出符合你描述的文件

而刚刚这一切都是通过AI PC本地资源完成的:ChatRTX使用检索增强生成(RAG)、NVIDIA TensorRT-LLM 大模型推理加速库和NVIDIA RTX 加速,将本地生成式AI功能引入到支持 RTX 的 Windows系统中。用户可快速、轻松地将本地文件作为数据集连接到开放式大语言模型,快速查询与上下文相关的答案。

看了这些RTX AI 技术Demo演示不难发现,有了NVIDIA技术的加持,AI PC早已不是停留在概念中的想象。这些具备了极高实用性的Demo正转变为创作者手中的生产力高速落地,在工作流中发挥着巨大作用,并给越来越多产业带来本质改变。

1

AI大算力如何实现?

从生态的角度来看,目前NVIDIA在AI领域的全栈生态给AI PC带来了极为重要的支持,毕竟这是一个已经耕耘了十多年的生态,即便此前发力的重点并不在PC平台这种边缘端,但其积累的各种库、中间件也足以为AIPC生态打下基础,比如说,我们今天看到的TensorRT-LLM for Windows几乎就可以看做发展有些年头的TensorRT在LLM上的延伸。

实际上,最早被用来做AI计算的NVIDIA GPU也正是游戏显卡:近代AI发展史知名的ImageNet图像识别大赛上,有团队尝试使用GTX 580加CUDA来跑卷积神经网络,随后就开启GPU加速AI的新时代。

而今天,在我们看到这些行业领先的Demo中,NVIDIA的技术所提供的大算力,几乎是目前AI PC体验的核心。

为了让更多创作者、开发者在AI PC发展的初期就能得到有效、客观的参考、更方便地选择自己的AI PC,国内头部AI大模型社区吐司/Tensor.Art联合NVIDIA发布了行业内首个《个人用户玩转Stable Diffusion的GPU配置推荐》。

在这份配置推荐中,吐司/Tensor.Art聚焦眼下最受关注的SD 1.5和SDXL ,通过第三方测试软件UL Procyon AI测试RTX 40 系列多款型号在Stable Diffusion的推理性能表现。



在UL Benchmark SD1.5和SDXL下,RTX40系显卡的表现


在开启TensorRT后的加速效果
在UL Benchmark SD1.5下,RTX 40系列笔记本电脑GPU表现

其中在UL Benchmark SD1.5 TRT vs. OpenVINO的对比测试中,RTX 4090笔记本电脑GPU相对于iGPU(Arc Graphics)有超过27倍的性能提升。


而在吐司/Tensor.Art这份性能参考报告之外,NVIDIA还联合火星时代教育发布了《NVIDIA TensorRT Stable Diffusion创作加速指南》和使用案例。指南包括安装与设置,加速引擎构建,加速效果对比及NVIDIA TensorRT在实际商业创作场景的应用方法——简单来说,这份指南可以帮助AI设计爱好者和创作者基于RTX 40系GPU在创作的各个环节中提升Stable Diffusion创作效率。

在活动现场,火星时代教育AI设计教研总监吴大吉还分享了NVIDIA TensorRT对于SD计算时间缩短的对比数据,数据显示TensorRT可以让GeForce RTX 40系GPU的SD生图速度最快提升约1倍,大幅缩短了创作时间。


TensorRT可以为RTX 40系GPU的提供非常出色的AI算力提升

看下来不难发现,NVIDIA过去十余年积累起来的AI生态正快速地融入AI PC,并为无数应用提供大算力支持。

1

老本行,新花样

在NVIDIA的老本行游戏领域,AI也同样正在重构游戏开发者的生产流程、以及游戏玩家的娱乐体验。

或许你还记得NVIDIA在去年曾经展出过一个赛博朋克拉面店的NVIDIA ACE技术Demo,基于玩家与NPC的对话,可以让老板提供饮料、更换灯光,甚至可以指着桌子上的东西问NPC这是什么,老板则会给你讲这东西的来历和意义。

在这次活动上,NVIDIA带来了一个全新的NVIDIA ACE技术Demo演示《Covert Protocol》,相比上次的Demo场景规模更大。在这个Demo中,三位NPC都有自己的性格与故事,玩家想聊什么都可以,他们的回答不仅会带出这个游戏世界的背景世界观,更是会让玩家感受到这个角色、这个世界是真实的、有生命的。对于游戏玩家来说,这是前所未有的虚拟世界代入感。


游戏中可以与NPC自由对话

实际上,这种技术不仅仅可以丰富游戏的内容,增加真实性。更是可能会进一步改变一部分游戏的叙事方式。

游戏行业有一种高阶叙事手法叫做“离散型叙事”,指将世界观背景与历史、剧情延伸、甚至是主要角色的故事分散并隐藏在NPC的对话、收集品、甚至是场景的设计中。让玩家通过互动主动发掘游戏内容。熟悉宫崎英高的各式魂系列作品的玩家想必对这种手法深有体会。

试想这种叙事手段与NVIDIA ACE技术结合以后,游戏过程中某一部分关键剧情、某个宝箱的打开方式、某个传奇武器的下落被游戏中某个“活生生”的AI NPC知晓着,而玩家需要通过话术找到真相。这种参与感绝非是固定脚本的游戏可以比拟的。

所以,尽管这项技术目前并没有被应用于已面世的游戏中,但它对游戏行业的改变,或许比很多人想得都要深,值得期待。

除了NVIDIA ACE之外,饱受玩家欢迎的NVIDIA DLSS也正在AI的加持下不断进步。作为一项 GeForce RTX GPU 上利用 AI 提高帧率并改善图像质量的功能,过去两年以来,在DLSS的帮助下,电脑性能一般的玩家也可以通过开启DLSS获得更高帧数的画面,电脑性能优异的玩家更是可以获得极致的视觉体验。


而最新的DLSS 3.5 不仅树立全新游戏标准,通过AI增强光线追踪表现,备受期待的《黑神话:悟空》和《永劫无间》即将支持DLSS 3.5光线重建和全景光线追踪技术,实现画质和性能将进一步获得大幅提升。

可以说,无论是生产力还是娱乐,NVIDIA都在利用其技术优势,帮助开发者提供充足、全面的开发工具,让更多的人可以低门槛地快速使用AI,并让更多人有机会从成果中受益。

1

结语

人人都能自由使用AI的时代,正越来越近。

尽管今天AI PC产品定义还处于早期,但得益于NVIDIA的高起点,其提供的大算力正在成为AI PC无数应用的前进的动力,AI PC的形象正在逐渐清晰,并开始改变我们熟知的生产力关系。据统计,RTX AI PC目前已经在全球范围内拥有超过1亿用户和超过500款游戏和应用支持NVIDIA RTX技术,并不断联手行业一起定义AI PC的新标准。

无论未来AI PC产品的走向如何,NVIDIA显然已经凭借全栈的生态布局取得了先发优势。GeForce RTX 40系GPU在TensorRT的加持下带来的大幅性能提升,显然已经使其成为眼下AI GC艺术家最合适的选择。曾经天马行空的AI幻想,似乎正在变成一个可以期待的未来。

本文标签: 显卡  pc  ai  算力  gpu  插件功能  nvidia  geforce  

相关推荐

猜你喜欢

大家正在看