ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验

风水师任强 132 0

一、ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验

ROCm:一个可移植 、高性能的 GPU 计算平台

随着 AI 时代的来临,显卡的作用不再仅仅只局限于游戏 ,特别是在 Stable Diffusion 火爆全网之后,越来越多的玩家将显卡当成 AIGC 生产力工具。

只不过,Stable Diffusion 的早期版本对 AMD 显卡支持不太友好 ,给大家造成了只有 N 卡才适合玩 AI 的错觉 。

可能很多同学不知道的是 ,AMD 的 Radeon GPU 也是能够做深度学习的,而且性能也并不差。

去年 12 月份,AMD 推出的 ROCm 6.0 开发平台进一步优化了 RX 7000 系列显卡的 AI 性能 ,特别是 Stable Diffusion 的出图效率更是获得了翻倍提升。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 1 张图片 - 小城生活

这里先解释一下什么是 AMD ROCm!

ROCm (Radeon Open Compute Platform )是 AMD 基于开源项目的 GPU 计算生态系统,类似于 NVIDIA 的 CUDA 。

ROCm 支持多种编程语言、编译器、库和工具,以加速科学计算 、自动驾驶 、人工智能和机器学习等领域的应用 。

ROCm 还支持多种加速器厂商和架构 ,提供了开放的可移植性和互操作性。

目前深度学习开发一般都是使用 Python 的,而大数据平台往往都会部署在 Linux 操作系统之上,因此 ,AMD ROCm 目前主要精力放在 Linux 系统上,Windows 端则还有待完善。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 2 张图片 - 小城生活

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 3 张图片 - 小城生活

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 4 张图片 - 小城生活

得益于双发射设计的流处理器单元,RX 7900 XT 仅凭 5376 个流处理器就达到了 55.4TFOPS 的单精度浮点运算性能 ,而拥有 10240 个流处理器的 RTX 4080 Super 浮点性能同样也是 55TFOPS 。

至于 RX 7900 XTX,其单精度浮点性能则接近 60TFOPS。

Stable Diffusion 主要依赖 GPU 的单精度浮点性能以及显存容量与带宽,这两方面 RX 7900 XT 都不逊于 RTX 4080 SUPER ,甚至显存容量还更大一些。

现在有了 AMD ROCm 6.0 的加持 ,终于可以发挥出这张顶级显卡的强大的 AI 算力 。

二、Stable Diffusion 出图速度对比:Linux 系统下出图效率近乎翻倍

测试平台如下:

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 5 张图片 - 小城生活

本次我们主要对比 RX 7900 XT/XTX 在 Ubuntu 与 windows 系统下的出图效率,看看 AMD ROCm 到底能带来多大提升。

1、RX 7900 XT 对比测试

首先是 Windows 11 系统,打开 Stable Diffusion 之后 ,我们设置 DPN++ 2M Karras 采样 、迭代步数 50、Euler a 采样、1024x768 分辨率 、CFG 为 7、总批次 10,单批数量 1。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 6 张图片 - 小城生活

在 Windows 系统下,RX 7900 XT 基于 DirectML 加速模式生成 10 张图共计耗时 9 分 51 秒 ,也就是 591 秒 。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 7 张图片 - 小城生活

进入 Ubuntu 22.04.3 LTS 系统,设置好 ROCm 之后,同样的参数与模型生成 10 张图只用掉了 5 分 05 秒 ,即 305 秒。

对比之下,在 Ubuntu 22.04.3 LTS 系统下,RX 7900 XT 的出图效率相比 Windows 系统高了足足 94%。

2、RX 7900 XTX 对比测试

使用同样的参数来测试 RX 7900 XTX 显卡 。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 8 张图片 - 小城生活

在 Windows 系统下 ,RX 7900 XTX 基于 DirectML 加速模式生成 10 张图总计耗时 9 分 18 秒,也就是 558 秒。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 9 张图片 - 小城生活

进入 Ubuntu 22.04.3 LTS 系统,设置好 ROCm 之后 ,同样的参数与模型生成 10 张图只用掉了 4 分 45 秒 ,即 285 秒。

在 Ubuntu 22.04.3 LTS 系统下,RX 7900 XTX 的出图效率相比 Windows 系统领先了 96%,也就是近乎翻倍的性能提升 。

三 、小结:高性价比的 AIGC 显卡

目前一张非公 RX 7900 XT 售价在 5299 元左右 ,对位的非公 RTX 4080 Super 售价则是 8599 元,N 卡贵了 60% 。其实在游戏性能方面,这两款显卡并没有太大差距。

现在 AMD 也意识到了 AI 应用对于 GPU 的重要性 ,加大了对 AMD ROCm 平台的投入,经过不断的更新,如今 AMD ROCm 6.0 在 AI 算力方面的提升早已超出了大多数玩家的预知。

在我们的测试中 ,RX 7900 XT 在 Linux 系统下使用 Stable Diffusion ROCm 6.0 版时,其出图效率几乎是 Windows 系统的 2 倍 。再加上 55TFOPS 的单精度浮点运算性能以及 20GB GDDR6X 超大容量显存,对于有较高专业 AIGC 应用需求的专业用户而言 ,在有限的预算下,RX 7900 XT 可以说是非常适合的选择。

当然,也希望 AMD 能够继续优化 ROCm 在 Windows 系统下的性能表现 ,让更多的 AMD 用户能拥有自己的高性价比 AIGC 显卡。

ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验 - 第 10 张图片 - 小城生活

【本文结束】如需转载请务必注明出处:快科技

责任编辑:流云

文章内容免责声明
1、本网站名称:吉运乾坤风水网
2、本站永久网址:https://www.mmssq.com
3	、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理	。
4、本站一切资源不代表本站立场	,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6	、本站资源大多存储在云盘,如发现链接失效	,请联系我们我们会第一时间更新。

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~