NVIDIA 在近日举行的 RTX AI 媒体品鉴会上,宣布了大量 AI 相关内容更新,同时现场还展示了 AI 在 PC 领域的广泛应用:NVIDIA ACE、ChatRTX、Stable Diffusion、 DLSS 3.5、NVIDIA app 以及来自众多 AI 艺术家基于 RTX 40 系列 Al PC 创作的 AIGC 作品。
NVIDIA 加速了向 Al 计算的转变,于 2018 年推出 RTX 技术和首款专为 Al 打造的消费级 GPU(GeForce RTX)。Al PC 是搭载专用 AI 加速硬件的计算机,在 RTX GPU 上,这些专用的 Al 加速器被称为 Tensor Core。运行要求极为严苛的工作和娱乐应用时,Tensor Core 能够显著加速 AI 性能,如 Stable Diffusion 1.5 和 SDXL 等热门的生成式 AI 模型。NVIDIA TensorRT 软件开发者套件可加速深度学习推理性能。
AI 性能的量化体现
衡量 Al 性能的一种方法是以 teraops 为单位。teraops 即 " 万亿次运算 / 秒 "(TOPS),TOPS 可作为单一指标让用户了解 PC 的 Al 性能,GeForce RTX 40 系列 GPU 可提供的算力,涵盖从 200 AITOPS 到 1200 AITOPS。与之相比,目前没有独立 GPU 的轻量级 AI PC 的算力仅为 10 至 45 TOPS。
为方便用户对比,NVIDIA 也将不同 GPU 的 AI 性能标注在官网上供大家查询。
全新的 UL Procyon Al 图像生成基准测试现已支持 TensorRT 加速,内部测试表明该基准测试可以比较准确地反映目前的实际性能表现。将 Tensor Core 与 TensorRT 结合后,本地 RTX AI PC 可获得卓越的生成式 Al 性能。
RTX AI PC 目前已成为拥有超过 1 亿用户和 500 款 Al 应用的生态。
游戏中的 AI
NVIDIA DLSS 是一项突破性图形技术,可在 GeForce RTX GPU 上利用 AI 提高帧率并改善图像质量。DLSS 3.5 树立全新游戏标准,通过 AI 增强光线追踪表现,备受期待的《黑神话:悟空》和《永劫无间》即将支持 DLSS 3.5 光线重建和全景光线追踪技术,实现画质和性能的大幅提升,为 GeForce 玩家带来极致体验。
NVIDIA RTX Remix 可让 Modder 轻松截取游戏素材,使用生成式 AI 工具自动增强材质,以及借助全景光线追踪和 DLSS 快速创建合人惊艳的 RTX 重制版游戏。
NVIDIA Freestyle 将通过全新的 NVIDIA app Beta 版提供,可让用户通过实时后处理滤镜个性化定制超过 1200 款游戏的视觉美学效果,并具有 RTX HDR、RTX Dynamic Vibrance(RTX 数字自然饱和度)等功能。
NVIDIA Broadcast 应用可将任何房间变成家庭工作室,为直播提供 AI 增强型语音和视频工具,包括噪音和回音消除、虚拟背景和 AI 绿幕、面部追踪、视频降噪和目光接触。
NVIDIA ACE 为游戏带来栩栩如生的 NPC
非玩家角色 ( NPC ) 通常在电子游戏的剧情推进过程中起着至关重要的作用,但由于它们一般是为固定目的而设计,对话和动作早已提前设定,因此在交互中可能显得机械而无趣,尤其是在拥有数千个非玩家角色的广阔游戏世界中。
NVIDIA 适时推出了 NVIDIA ACE,为游戏开发者和数字创作者带来了制作逼真 NPC 的利器。开发者可通过 ACE 微服务将先进的生成式 AI 模型集成到游戏和应用内的数字虚拟形象中。通过 ACE 微服务,在交互的过程中,不仅能实现精确的语音转换文字,同时还能为 NPC 提供逼真的面部表情。NVIDIA ACE 将认知、感知和行为系统集成在一起,在精心制作的环境中呈现今人惊叹的 RTX 渲染角色,以实现身临其境的叙事效果。ChatRTX,听得更多,看得更多,聊得更多
ChatRTX 使用检索增强生成技术,经由 NVIDIA TensorRT-LLM 软件和 NVIDIA RTX 加速,为 RTX Windows PC 和工作站带来聊天机器人功能。ChatRTX 运行在本地,用户可在 LLM 的支持下查询自己的笔记和文档,ChatRTX 将针对查询快速生成相关回应。
最近更新的 ChatRTX 版本中,不仅增加了对更多 LLM 大模型的支持,还加入了对语音、图像的交互支持。
创作中的 AI 应用
SD 专业工作流:RTX 4090 D GPU 在复杂的控制工作流和出图质量中表现出真正的生产力,通过人像生成控制模型,让用户足不出户就能通过搭载 RTX 4090 D 的 RTX AI PC,将普通摄像头的自拍照生成高质量影棚级别的肖像照。而目前,RTX GPU 能为 Stable Diffusion 用户带来生产力级别的体验。
SD 一秒生成 8 张图:作为市面上最快的 Stable Diffusion 计算出图方案,用户能在 RTX 4090 D GPU 享受到高达每秒 8 张图的生成速度。使用当前最快的 StableDiffusion 加速方法 TensorRT,再配合开发者进一步的性能优化,目前 RTX 4090 D GPU 最高能实现每秒超过 100 张图的生成速度。
声音克隆:基于 RTX GPU 加速的声音克隆可仅用 5 秒录音来克隆声音,实现无需训练的个性化声音生成。基于开源的 GPT-SoVITS 项目,声音克隆根据 5 秒录音样本的发音特征由文本生成个性化语音片段,实现高质量的声音克隆,在 RTX Al 的加速下,这个过程仅仅五分钟就能完成;而基于更多样本(1 分钟)的微调训练能够实现接近 1:1 复刻的声音克隆。
实时建筑渲染:在建筑设计领域,即致 AI 基于扩散模型和蒸馏技术,通过 RTX GPU 的加速,实现了秒级的 Al 实时绘画。结合即致 Al 自研的全网下载量超 50W 国内建筑行业大模型,帮助建筑设计师享受 Al 实时渲染划时代的快捷、便利的同时,依然可以保证极高的出图效果。
AI PC 拐点已至,RTX 独领风骚
毋庸置疑,AI PC 的发展正在改变我们的日常生活和工作效率,全行业拥抱 AI 正在成为现实。在 AI 加速领域,NVIDIA 独领风骚,地位超然。基于 RTX GPU 的 AI 应用计算加速不仅无出其右,更是拥有广泛的应用生态。可以毫不犹豫地说:RTX AI PC 将为各行业带来 AIGC 生产力革命!