许可优化
产品
解决方案
服务支持
关于
软件库
当前位置:服务支持 >  软件文章 >  Keyshot CPU与GPU渲染性能大比拼

Keyshot CPU与GPU渲染性能大比拼

阅读数 7
点赞 0
article_banner

使用64核AMD Threadripper 3990X和72 RT核NVIDIA Quadro RTX 6000 对KeyShot中的渲染功能和结果进行了研究。

在Luxion办公室,有一个新的工作站,配备了AMD Threadripper 3990X CPU和NVIDIA Quadro RTX 6000 GPU。它们的价格都在3500美元左右,并且每个都代表着工作站中CPU或GPU可获得的最佳性能。

keyshot 渲染慢,提高渲染速度用渲云影视云渲染平台,批量渲染,速度快不止10倍,支持cpu和gpu渲染,支持大场景渲染。云渲染是在不改变现有配置的情况下享受高速渲染的服务,是提升渲染速度,节省渲染时间的最佳选择。

规格

AMD Threadripper 3990X CPU是基于惊人的禅宗架构,AMD在2017年的3990X是目前最快的工作站CPU(忽略基于服务器的AMD处理器EPYC)提出。它具有64个核心,并允许128个并发线程。它具有总共292 MB的片上高速缓存,以及95 GB / s的内存带宽。它采用了一种状态的最先进的7nm的过程,并具有约280 W.功耗

NVIDIA的Quadro RTX 6000 GPU它基于NVIDIA在2018年推出的革命性Turing架构 。它具有72个专用于光线跟踪的RT核,4608个专用于阴影和通用计算的CUDA核以及576个用于深度学习和去噪的Tensor核。它具有24 GB的GDDR6内存,带宽为672 GB / s。它使用的是12nm工艺,功耗约为295W。

KeyShot历史记录

Luxion于2006年3月向公众展示了交互式光线追踪技术。当时的光线追踪代码在AMD Opteron架构上运行。从那时起,我们改进了光线跟踪代码,以充分利用最新CPU的开发优势。在2010年,我们在基于40核/ 80线程,基于Intel Westsomere四插槽的工作站上演示了KeyShot,该工作站包括对超过10亿个独特多边形的交互式光线跟踪。在内部,Luxion早在2011年就致力于GPU射线追踪,但经过全面分析,我们得出的结论是,当时有限的内存和性能无法使其与我们的CPU渲染器竞争。

在2018年,当NVIDIA推出带有专用光线追踪硬件的RTX架构时,这一切都发生了变化。在Luxion,我们决定是时候支持GPU渲染了,2019年11月发布的KeyShot 9增加了对使用RTX和OptiX 7进行GPU渲染的完全支持。我们将CPU渲染分开,为用户提供了使用CPU的选项,如所有以前的KeyShot版本或新的KeyShot 9 GPU渲染一样。

GPU渲染使用略有不同的算法,因为GPU在均匀的并行工作负载下表现最佳。这确实意味着,与CPU算法相比,GPU算法收敛到无噪声图像的速度更慢。但是,GPU上的大量计算线程的确允许更高的吞吐量,并且最近添加的快速去噪算法进一步缩小了暴力GPU算法与更复杂的CPU算法之间的差距。

KeyShot基准测试

多年来,我们收到了许多问题,关于哪种CPU可以提供最佳性能,并且随着GPU渲染的引入,我们收到了更多的问题。
在KeyShot中,著名的摄影机场景用于测试性能已有多年。但是,它非常简单,并没有真正显示出快速硬件的好处。在KeyShot 9.3中,我们引入了新的KeyShot Benchmark工具,该工具可与免费的KeyShot Viewer一起使用。,可启用CPU和/或GPU基准测试。我们的基准测试使用了Magnus Skogsfjord创建的精美的麦克风产品场景。为了提供适当的基准,我们已经校准了输出质量以在CPU和GPU上都匹配,因此GPU正在跟踪更多的光线以获取最终图像。作为基本性能,我们使用运行于3.2GHz的8核/ 16线程i7-6900K CPU,并将其校准为1.0。

新工作站上的KeyShot基准测试结果:
AMD Threadripper 3990X: 11.83
NVIDIA Quadro RTX 6000: 34.73

对于我们工作站上的产品场景,这些结果表明GPU大约比CPU快三倍。对于CPU和GPU,KeyShot都能将工作负载维持在98%以上,这意味着KeyShot充分利用了硬件的并行方面。

AMD Threadripper 3990X提供了迄今为止KeyShot最快的工作站CPU性能。它的速度大约是AMD Threadripper 2990WX处理器(32核/ 64线程)的两倍,并且几乎是Intel i7-6900K处理器(8核/ 16线程)的12倍。

同样,NVIDIA Quadro RTX 6000提供了迄今为止KeyShot最快的单GPU性能。新的RTX卡比基于Pascal架构的上一代NVIDIA GPU快大约六倍。这显示了Turing架构中添加的新RT内核 的优势,该内核使GPU能够将真实产品场景的光线跟踪性能推到可用的最佳CPU之上。

该性能与我们在其他产品场景中所看到的大致相符。对GPU和CPU的性能进行的初步分析表明,对于我们分析的许多产品场景,内存带宽是CPU和GPU的限制性能。

在运行基准测试时,我们还注意到连接到工作站的UPS报告的功耗。

AMD Threadripper 3990X: 530瓦
NVIDIA Quadro RTX 6000: 450瓦

虽然这些值相当接近,但是这让我们有些惊讶,因为我们认为GPU和12纳米制程的蛮力本质会导致更高的功耗,但是这些值确实说明了现代GPU架构的效率。

KeyShot GPU渲染

使用新的NVIDIA RTX卡,KeyShot的运行速度非常快。上载数据并编译着色器后,工作流程将非常流畅且快速。GPU的挑战之一是内存不足。具有很多几何和纹理的非常复杂的场景可能无法在GPU上放置,这使CPU成为唯一选择。可以将纹理从CPU内存交换到GPU,但这会降低性能。

GPU可以处理非常复杂的场景。借助两块使用NVIDIA NVLink的RTX 5000卡,结合了32 GB的内存,我们已经能够对包含13.7亿个唯一三角形的场景进行光线追踪。但是,通过NVLink共享几何确实会带来相当大的性能损失。对于复杂的场景,具有24 GB的Quadro RTX 6000或具有48 GB的Quadro RTX 8000提供了相当大的几何和纹理空间,这些卡可能仍使用NVLink提供多达96 GB的共享GPU内存。

新的Turing架构还带有非常快速的AI去噪器,仅需几十毫秒即可对帧进行去噪。与CPU相比,这对于交互式工作流来说是一个巨大的优势,而CPU基于深度学习的最先进去噪器需要几秒钟的时间。

GPU渲染的另一个显着优势是,只需向工作站添加更多GPU,就可以轻松扩展性能。大多数台式机工作站支持多个GPU,并且我们发现,性能随添加的每个附加GPU几乎呈线性扩展。

KeyShot CPU渲染

借助RTX架构获得的高性能,人们可能会问是否仍然需要CPU渲染?这个问题的答案取决于工作流程。对于大多数产品场景,GPU确实提供了出色的性能,但是对于具有许多几何和纹理的高度复杂的场景,具有更多内存访问权限的CPU变得更具竞争力。尽管可以在GPU上渲染如此复杂的场景,但更容易管理CPU上的数据,并且即使在性能方面,CPU在GPU和主内存之间移动的开销也可能意味着CPU是更好的选择。看法。

此外,在阴影行为差异很大的场景中,CPU的性能优于GPU。一个例子是Esben Oxholm的泡沫头。它使用由3D程序纹理调制的异质散射介质来获得复杂的泡沫外观。在GPU上,散射介质与位置相关的过程纹理结合在一起会导致发散行为,从而显着降低GPU的速度。因此,在渲染此场景时,3990X的速度是RTX 6000的三倍。

CPU具有优势的另一个领域是准确性。KeyShot对光线跟踪核心的某些关键部分使用双精度(64位)浮点,以确保高度精确地处理几何图形。RTX架构依赖于单精度(32位)浮点数,这确实限制了大型场景中的精度,并且可能导致间隙或不正确的阴影。

为了获得最高的准确性,CPU上的KeyShot确实有一个额外的技巧:NURBS的直接光线跟踪。光线追踪NURBS意味着几何图形将始终保持平滑。当使用包含小零件的大型模型时,直接使用NURBS光线跟踪 非常有用。当这些模型转换为三角形时,较小的零件通常使用较少的三角形,因此看起来面朝上。相反,NURBS模型在所有距离上都看起来很平滑。NURBS渲染比渲染三角形要慢,但是它允许用户在设置过程中使用相对粗略的三角形模型,然后切换到精确的NURBS光线跟踪以进行高分辨率的最终帧渲染,而不必担心可视化多面几何体。

结论

AMD Threadripper 3990X和NVIDIA Quadro RTX 6000都非常适合在KeyShot中进行渲染。理想的工作站应该兼有!

Threadripper 3990X可以非常快速地设置场景,处理几何图形并最终对其进行渲染。它提供了非常流畅的交互式工作流程,并允许直接NURBS射线跟踪和场景复杂性,仅受可用内存的限制。64核/ 128线程将性能提高到比8核/ 16线程Intel i7 CPU快12倍。AMD Threadripper 3990X是当今您可以购买的最快(并且我会最好地添加)用于渲染的CPU。

同样,Quadro RTX 6000卡的渲染速度也非常快。新的RT内核将性能提升到比8核/ 16线程Intel i7快35倍,比3990X CPU快约3倍。结合对Quadro RTX 6000上的交互式工作流进行去噪,效果极佳,几乎可以立即获得最终结果,对于脱机渲染动画,这真是天赐之物,比以往任何时候都更快地创建帧。为了获得最快的渲染性能,强烈建议您在工作站中使用一张或多张Quadro RTX 6000卡。

文章来自keyshot官网,如有侵权请联系删除。

相关推荐:

keyshot 10.1的特色功能,赶紧用起来!

keyshot中如何创建关键帧动画?


免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删
相关文章
QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空