MPI Application rank 0 exited before。。。
the fl process caoud not be started。。。
这种问题出现fluent基本就是凉了,什么都点不了
临时解决方法:根据console面板计算的残差,使用记事本打开最近的data,将最后的数据改为面板中的数据,这样读最近的data时会读出中断前最后一步的数据,具体怎么改,需要专业操作了。
原因分析:并行计算时受到内存的突然大占用,或者并行程序受到压缩,会导致以上问题出现。一般原因多为每个线程需要的内存不够,只要一个不够就会断。
重启动后的解决方法:
1.断网运行,保证充足内存(8线程笔记本,设定自动保存动画就会爆,内存如果不够32G不要设置自动保存动画,不要设置动态监视)(运行内存占用不要超过80%)
2.降低线程(之前8个,现在改成6个),算的慢了点,但稳定呀
3.开启自动保存data,每半小时保存一次,以防万一
4.开启单核,适合晚上跑,慢但稳定
5.intel mpi就是有这个问题,你用ibm mpi跑,这个设置在启动界面里,有个并行选项,能选,ibm mpi算的慢,300万网格intel算9秒。ibm需要10秒。
6.更改许可证,换那个网络许可证,然后用网线联网运行,或者全程断网模式。与此同时,打开网络连接设置,打开ipv4协议,有一个网络速率设定,建议改成全双工最大值,而不是自动选择。
7.中断是瞬间往往是因为cpu计算量溢出,或者内存爆了,建议计算机管理中,增大虚拟内存或者硬件加几个内存条,(48线程约需25G内存),与此同时关闭计算机的电源管理中的自动关闭硬盘等待时间。
8.和关闭屏幕的脉冲有关系。建议笔记本常亮,大内存计算机忽略这个问题。
9.多路服务器,需要进入bios系统,打开cpu turbo boost,如图设置,多路服务器建议非满线程运行。
图片摘自网络,自己懒得拍
10.与笔记本电脑电流变化有关系,建议使用稳流电源
11.与收敛因子有关,尝试调低收敛因子(controls里的收敛因子)
12.与编译器环境有关,建议检查编译器的位置,同时fluent要和该版支持的编译器匹配。(例如18.2支持vs2013,不支持vs2019这种的)
具体在那里看的话,我以后放一个视频。
13.建议切换成乌班图系统断网运行。这个比win平台稳定
14.启动界面有mpi求解器设定,建议不要用默认,选择intel mpi
15.并行选项配置错误。多主机运行时需要正确配置接口,环境。这个太专业了不方便细说。总体原则就是先用简化模型测试环境,测试通过后再用正式模型
16.对于大型流体计算,先算稳态再算瞬态。效果好
17.UDF编译解算溢出。因为编译和机翻速度不一样,所以建议用编译来实现udf,或者matlab与fluent联合仿真。这样求解快。
18.增大时间步长和迭代次数,保证数据收敛。如0.001秒/20迭代,改成0.0005秒/30迭代,不容易报错,适用于初期报错。
19.中期报错,80%的原因是迭代次数太少,步长不够
20.通常是显示算法报错,用隐式来算…就没问题
21.使用workbench启动,稳得一批。
最佳方法:降低线程数,内存占用不超过80%,每一小时自动保存一次data,全程断网或联网,关闭无用程序,关闭电源管理的节能设定,保持硬盘用不休眠,使用隐式算法,缩短步长增加迭代。。
加油特种兵,
交流群1015846486