NVIDIA 媒体品鉴会回顾:AI 即将深入生活的方方面面

2022 年年初,ChatGPT 3.5 的公布让大众直观见识到了「AI」的进化幅度,而不久之后的 Stable Diffusion 又让没接受过任何艺术训练的「小白」也能尝试绘画的乐趣。但两年过去,似乎过了那段「新鲜劲儿」之后,AI 在我们日常生活中的「渗透」程度似乎并没有想象中那么高。

实际上确实如此吗?

全球 AI 行业领军人之一的 NVIDIA,近日在其深圳办公室展开了一次「RTX AI 品鉴会」,现场邀请了吐司/Tensor.Art、火星时代教育、海辛、言萧等合作伙伴和 AI 艺术家伙伴的嘉宾们,就现阶段的几个 AI 案例进行了分享,还向大家展示了很多 AI 深入生活的实例。

自 2018 年英伟达的显卡从「GTX」开头转变为「RTX」以来,AI 加速器「Tensor Core」在 GPU 中所占据的「分量」就越来越重,使得消费级显卡也逐渐拥有了曾经云端才能实现的功能。

以 GeForce RTX 40 系显卡为例,40 系桌面端与笔记本电脑 GPU 可提供的算力,涵盖了从 200 AI TOPS(万亿次运算每秒)到 1300 AI TOPS 之间;而作为对比,没有独立 GPU 的轻量级 AI PC 仅能提供 10 到 45 TOPS。

在线生图 AI 模型社区「吐司/Tensor.Art」发布了一系列完整评测,测试了 GeForce RTX 40 系多款GPU基于 Stable Diffusion 的 AI 生图能力,并总结了一篇《个人用户玩转 Stable Diffusion 的 GPU 配置推荐》,方便入门用户选择合适的配置。

在《个人用户玩转 Stable Diffusion 的 GPU 配置推荐》中,吐司/Tensor.Art 聚焦 SD 1.5 和 SDXL 1.0,使用第三方测试软件 UL Procyon AI 基准测试完整测试 RTX 40 系列多款型号的显卡、笔记本电脑 GPU 在 Stable Diffusion 的推理性能表现。

其中在 UL Benchmark SD1.5 TRT vs. OpenVINO 的对比测试中,RTX 4090 笔记本电脑 GPU 相对于 iGPU(Arc Graphics)有超过 27 倍的性能提升。  

AI 学习机构「火星时代教育」则制作了一套详细教程《NVIDIA TensorRT Stable Diffusion 创作加速指南》,详细介绍了 SD 的安装、设置、加速引擎构建、实际应用场景,旨在帮助创作者快速实现创意落地,提升创作效率。

游戏领域,本次英伟达主要展示了还在开发中的「NVIDIA ACE」技术 Demo。

《Covert Protocol》是一部应用了此技术的 Demo,由 Inworld AI 公司开发。玩家要扮演一位私家侦探,试图在酒店中获取目标人物的必要信息。与一般的冒险推理游戏相比,玩家在这个 Demo 中可以直接与 3 位 NPC 对话,并获得实时反馈,突破了传统游戏中的「互动」界限。

为了实现这一功能,《Covert Protocol》集成了 NVIDIA Riva 与 NVIDIA Audio2Face 技术,前者是精确的语音转换文字插件,后者可以基于语音自动适配口型,再结合类似 ChatGPT 的 AI 云端实时对话系统,使得我们能在游戏中「即时」与任意 NPC 进行真正意义上的互动。

英伟达表示,目前已有腾讯、米哈游、网易等诸多国内游戏公司正在基于此技术开发游戏,而国际上首个应用这一功能并上架 Steam 的作品或许将是前暴雪员工组建的「冰霜巨人」工作室所开发的 RTS 游戏《风暴之门》。

NVIDIA RTX Remix 是一个正在内测中的 AI 工具,能够帮助 Mod 开发者快速截取游戏素材,利用 AI 自动增强老游戏的材质、贴图,并借助全景光追和 DLSS 快速「重制」经典游戏。目前已经可供玩家体验的内容如《传送门》,已拥有游戏的玩家可以通过免费升级来体验这款十几年前的作品在「RTX Remix」优化后的效果。

现场还展示了《心灵杀手 2》和《传送门》RTX 版经过光追与 DLSS 3.5 加持之后的画面对比,这些游戏想必各位玩家都很熟悉,就不多介绍了。

一个能让国内玩家兴奋的消息是,将于今年 8 月上市的《黑神话:悟空》会在上市当日就支持 DLSS 3.5 光线重建以及全景光线追踪技术,实现画质与性能的同步提升。

最后是已经在测试中的 PC 端应用程序NVIDIA app 。简单的说,它是一款用于替代现有「GeForce Experience」的新软件,提供各式显卡设置与游戏优化 —— 最有意义的改动是更新驱动再也不用注册/登录英伟达账号了。

接下来有一些我们能在生活中应用到的案例。

基于人像生成控制的 Stable Diffusion 模块化插件 InstantID,我们可以将任何一张具备面部特征的照片直接生成影棚级肖像照、证件照 。现场还拉了一位媒体朋友作演示 —— 在搭载了 RTX 4090D 桌面端 GPU 的台式机上,生成这样一张肖像照仅需几秒。

还有非常神奇的声音克隆技术。通过采集一段 5 秒钟的录音,GPT-SoVITS 项目可以以此为基础实现高质量声音克隆;如果能提供更长时间的样本(1 分钟左右),甚至能生成基本 1:1 的高质量语音,极大节省了「人工配音」所需时间,亦或通过采集亲人信息,来实现更多人文关怀角度的应用。

建筑设计领域,一款名叫「即致 AI」的工具基于扩散模型和蒸馏技术,在 RTX GPU 的加速下,能在几秒内完成从手绘草图到实时渲染的全过程,极大提高设计师的工作效率。虽然现阶段应用还仅限于家装、公装与建筑外观设计,但相信推广到工业设计、服装设计等领域仅仅是时间问题。

最后是类似「ChatGPT」的本地应用演示Demo,ChatRTX。

ChatRTX 使用检索增强生成、NVIDIA TensorRT-LLM 软件和 NVIDIA RTX 加速,将本地生成式 AI 功能引入到支持 RTX 的 Windows 系统中。用户可快速、轻松地将本地文件作为数据集连接到开放式大语言模型(如:来自智谱 AI 的 ChatGLM3-6B),快速查询与上下文相关的答案。

由于数据与运行都在本地,有着其他对话类应用难以比拟的速度优势。ChatRTX 还支持图像识别,能迅速实现图片库中进行检索的能力。比如在图像识别模型中输入「沐浴在阳光下的房间」,它就会筛选出符合需求的图片;输入特定文字,还能找到包含相关文本的图片 —— 想必在财务、报账相关领域能得到广泛应用。

以上这些案例和应用绝大多数已经对外发布,有兴趣的用户随时可以尝试;而腾讯、米哈游、育碧等开发商也在着手将 NVIDIA ACE 应用于游戏领域,想必很快就会有「成品」面世。

为您推荐

发表评论

邮箱地址不会被公开。 必填项已用*标注