把一台超级工作站的性能,变成三台机器的性能,神奇不?下面我们来介绍这个PCA
(一)多核并行计算存在的问题
随着计算机硬件的不断升级换代, 超级图形工作站的CPU核数会越来越多,目前已经到112核,但是在CAE仿真计算、科学计算、计算化学等应用软件,多核并行计算的核数基本都是有限多核的,不是机器核数足够大,就能并行计算就更快,例如:HFSS理想并行计算CPU核数是28个、ABAQUS理想并行计算核数48个等。
这些仿真计算,机器核数再多,求解反倒没有缩短,甚至变慢,
现实情况是,一台超级图形工作站,虽然硬件架构和频率非常高,但最大的核数无法完美发挥其计算性能。
图1
如何更有效的利用超级图形工作站的四颗Xeon的多核和完美的内存带宽,发挥最高的计算效能,西安坤隆计算机公司专注高性能计算应用,为此开发的PCA(Parallel Computing Acclerator,并行计算加速器),工作站预装PCA,大幅提升机器多核并行计算使用率,翻倍提升计算速度。
(二)UltraLAB PCA(并行计算加速器)介绍
西安坤隆计算机公司开发出的PCA加速器,在机器配置比较多CPU核数(通常96核以上),虚拟出多台机器(每台配备根据软件并行计算的最佳核数),然后再并行计算,相当于多台物理机并行计算,充分利用软件算法特点和机器硬件配置架构,把一台机器变成多台机器并行计算,大幅提升整机仿真计算速度。
图2
2.1 PCA介绍
对于很多CAE仿真用户来说,需要尽量选用最新最合理硬件配置来进行仿真求解,同时需要尽可能地共享软件和硬件资源。例如,选用最高端工作站
4颗Xeon 铂金8380H(共计112核)/3TB DDR4 3200 RDIMM
用于ANSYS Mechanical的仿真求解,最合理的是虚拟出2台逻辑工作站(每台48核/768GB)如下图所示:
图3 Ansys EM compute resources设置
图4 提交工程进行并行计算
使用者通过UltraLAB PCA加速器,一台超级图形工作站,虚拟出2台或3台或更多台高性能工作站,对ANSYS软件进行并行仿真计算。
PCA加速器能够充分利用ANSYS软件以及计算服务器的资源,进行仿真计算作业调度和分配。
图5 测试结果
从图5汇总结果,超级工作站借助PCA加速工具,求解速度提升3倍以上,
2.2 PCA技术特点
目前大部分图形工作站都是单机并行计算模式,使用者是基于Windows单机软件开始接触和使用CAE软件的, 随着计算规模越来越大,对硬件配置要求也在不断提升,但是核多出现了并行计算效率瓶颈
PCA加速器解决了过多CPU核无法发挥的缺陷,让超级工作站的多核完美发挥出最大算力潜能,1台机器变成多台机器并行计算能力。
PCA加速器面向CAE仿真计算/科学计算/计算化学等行业,为其提供超级计算能力,同时具备后台计算资源和完善友好的作业提交管理界面,支持多用户多作业并发提交与管理。也支持双机扩展计算能力。
我们将多年的在CAE仿真计算领域的硬件配置经验,整合到PCA系统。
未来2年内,超级图形工作站总核数估计4*96=396核以上,这样的借助PCA加速器,求解速度提升幅度更大、更显著。
2.3 PCA加速器应用
PCA加速器为仿真计算(CAE)、科学计算、计算化学带来如下的价值:
2.4 PCA支持应用软件列表
No | 软件类别 | 软件名称 |
1 | 结构仿真 | ANSYS Mechanical、ANSYS AutoDYN、ANSYS LS-Dyna 、Abaqus、MSC Nastran |
2 | 流体仿真 | ANSYS CFX、ANSYS Fluent、StarCCM+ |
3 | 多物理场耦合 | Comsol Multiphysics、ANSYS Multiphysics |
4 | 电磁仿真 | ANSYS HFSS、ANSYS Maxwell、FEKO、CST Studio Suite,StarCD |
5 | 科学计算 | MatLAB |
6 | 计算化学 | 量子化学、分子动力模拟 |
7 | 开源类 | 基于开源MPI仿真计算程序 |
2.5 PAC运行环境
No | 设备类 | 技术规格 |
1 | 硬件 | 基于Alpha730、Alpha750机型, 主要配置: 4颗Xeon 第2代/3代可扩展处理器(最大112核,建议96核以上) 最大6TB DDR4 2933/3200 RDIMM 若干个高速缓存盘(2TB/4TB/8TB PCIe SSD) |
2 | 操作系统 | Windows2016及以上版本 |
3 | 客户端 | Win7,Win10 |
免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删