许可优化
许可优化
产品
产品
解决方案
解决方案
服务支持
服务支持
关于
关于
软件库
当前位置:服务支持 >  软件文章 >  MATLAB内存不足的解决方法:优化内存使用与大数据处理技巧

MATLAB内存不足的解决方法:优化内存使用与大数据处理技巧

阅读数 6
点赞 0
article_banner

今天用Matlab跑程序,由于数据量太大,又出现Out ofmemory. Type HELP MEMORY for your options.的问题。看到这篇文章非常实用,转过来方便查阅~

用 Matlab 进行大规模科学计算或仿真时,内存是一个需要时常注意的问题。在matlab里运行


   >>system_dependent memstats


   就可以看到内存的使用状况。当你写的 Matlab 程序跳出“Out of Memory”时,以下几点措施是需要优先考虑的解决方法:


   1. 升级内存


   2. 升级64位系统


   3. 增加虚拟内存


   4. 采用3GB开关启动系统


   由于32位 Windows   操作系统的限制,每个进程只能使用最多 2GB 的虚拟内存地址空间,因此 Matlab的可分配内存也受到相应的限制。Matlab 7.0.1 引进了新的内存管理机制,可以利用 Windows 的 3GB 开关,使用3GB 开关启动的 Windows 每个进程可以在多分配 1 GB 的虚拟地址空间。具体做法是:修改C盘根目录 boot.ini启动选项加上 /3G,例如:

   multi(0)disk(0)rdisk(0)partition(1)\WINDOWS=" Microsoft Windows XPProfessional" /noexecute=optin /fastdetect /3G


   5. 如果必有必要,不要启动java虚拟机,采用matlab -nojvm启动 (在快捷方式属性里面的"..../matlab.exe") 改为("...../matlab.exe" - nojvm)


   6. 关闭Matlab Server
 控制面板-管理工具-服务,再找到matlabserver对应项,把启动类型的自动改为手动即可

matlab server作为后台服务可以在其它机器上通过网络调用此服务,进行计算任务。

7. Windows中字体、窗口等都是要占用系统资源的,所以在Matlab运行时尽量不要打开不用的窗口。


   除此以外,更关键的是需要弄清楚以下几个问题:


   问题一:Matlab是如何存储矩阵的?

   Matlab中矩阵是以Block,也就是块的形式存储的。也就是说,当Matlab在为即将存储的矩阵划分块时,如果没有相应大小的连续内存,即使实际内存没有被完全使用,它还是会报告“Outof Memory”。


   问题二:如何高效使用Memory?

   Matlab 中数组必须占用连续分配的内存段,当无法为新建的数组分配连续的内存段的时候,”Out of Memory”就会出现。在使用的过程中,由于存储单元的不断的被分配和清除,反复分配和释放数组会使内存被分割成不连续的区域,可用的连续内存段减少,很容易造成“Out of Memory”。因此当 Matlab 刚刚启动时其连续内存最多,此时往往可以新建非常大的数组,这一点可以用命令feature(’memstats’)(在 7.0版本以上)看出。如果现实的最大连续内存段很小,但实际可用内存(非连续的)仍旧很多,则表明内存中碎片太多了。此时可以考虑用 pack命令,pack 命令的作用就是将所有内存中的数组写入硬盘,然后重新建立这些数组,以减少内存碎片。此外,在命令行或者程序中都可以使用clear 命令,随时减少不必要的内存。


   因此,治本的方法如下:


   1. 在命令行输入 pack 整理内存空间


   当内存被分为很多碎片以后,其实本身可能有很大的空间,只是没有作构的连续空间即大的Block而已。如果此时Out ofMemory,此时使用pack命令可以很好的解决此问题。


   2. 使用稀疏矩阵或将矩阵转化成稀疏形式 sparse


   如果矩阵中有大量的0,最好存储成稀疏形式。稀疏形式的矩阵使用内存更少,执行时间更短。例如:

   000×1000的矩阵X,它2/3的元素为0,使用两种存储方法的比较:


   Name

   Size

   Bytes

   Class


   X

   1000x1000

   8000000

   double array


   Y

   1000x1000

   4004000

   double array (sparse)


   3. 尽量避免产生大的瞬时变量,把没必要的变量clear掉或当它们不用的时候应该及时clear。


   4. 减少变量,尽量的重复使用变量(跟不用的clear掉一个意思)。


   5. 把有用的变量先save,后clear 掉,需要时再读出来。


   下面介绍一下关于clear、save、load的特殊用法,这对在for或while等多重循环里出现out ofmemory非常有效。


   for k =1:N    % N为循环次数

   % ---------------------
  var0 = k; %获得变量var0                        

   %----------------------
  string = [sprintf('var_%d', k) ' = var0;' ];
  eval_r(string);                                              % 等价于 var_k = var0;
  save(sprintf('var_%d.mat', k), sprintf('var_%d')); % 等价于 savevar_k.mat var_k
  clear(sprintf('var_%d'));                                  % 等价于 clear var_k

   end


   如果要读取刚才存取的变量var_k, (k = 1,2, ..., N). 那么,可以使用如下用法:


   for k = 1:N
    load(sprintf('var_%d.mat',k));    % 等价于 loadvar_k.mat    k = 1,2, ..., N

   end


   另外,还有一些非常有用的用法。如果用清除刚才读取的变量 var_k, k = 1, 2, ..., N


   clear '-regexp''^var_'    % 清除所有以“ var_ ”开头的变量


   还有很多关于save、clear、load等用法,具体 help 一下。


   6. 使用单精度 single 短整数替代双精度 double


   Matlab 默认的数字类型是双精度 浮点数   (double),每个双浮点数占用 8个字节。对于一些整数操作来说,使用双浮点数显得很浪费。在 Matlab中可以在预先分配数组时指定使用的数字类型如以下命令:zero(10, 10, ‘uint8′)。对于浮点数,在很多精度要求不高的情况下,可以使用4个字节的单浮点数(single),可以减少一半的内存。关于单、双浮点数的精度对照如下,以便根据需要选择使用:

   single: 精度 (1.1921e-007) 最大数 (3.4028e+038)

   double: 精度 (2.2204e-016) 最大数 (1.7977e+308)


   7. 为矩阵变量预制内存而不是动态分配


   在动态分配的过程中,由于开始Matlab所用的Block随着矩阵的增大而连续的为此矩阵分配内存,但是由于Block的不连续性,很有可能最开始分配的Block不能满足存储的需要,Matlab只好移动此Block以找到更大的Block来存储,这样在移动的过程中不但占用了大量的时间,而且很有可能它找不到更大的块,导致Out ofMemory。而当你为矩阵变量预制内存时,Matlab会在计算开始前一次性找到最合适的Block,此时就不用为变量连续的分配内存。比较下面两个程序:


   for k = 2:1000
  x(k) = x(k-1) + 5;

   end


   x = zeros(1, 1000);

   for k = 2:1000
  x(k) = x(k-1) + 5;

   end


   显然,第二个更好!!!最好的方法是,在程序一开始就位所有大的矩阵变量预制存存储单元!!!


   8. 尽量早的为大的矩阵变量预制内存


   Matlab使用heap method管理内存。当在Matlabheap中没有足够的内存使用时,它会向系统请求内存。但是只要内存碎片可以存下当前的变量,Matlab会重新使用内存。比如:


   a = rand(1e6,1);

   b = rand(1e6,1);

   使用大约15.4 MB RAM


   c = rand(2.1e6,1);

   使用近似16.4 MB RAM


   a = rand(1e6,1);

   b = rand(1e6,1);

   clear

   c = rand(2.1e6,1);

   使用32.4 MB RAM


   Matlab不能使用a、b被clear的空间,因为它们均小于2.1 MB,而同时它们也很可能是不连续的。最好的方法:


   c = rand(2.1e6,1);

   clear

   a = rand(1e6,1);

   b = rand(1e6,1);

   使用16.4 MB RAM


   9. 如果可行的话,将一个大的矩阵划分为几个小的矩阵,这样每一次使用的内存减少。

经过保存需要的变量,删除不必要的变量,运行pack命令,系统前后的内存占用情况有了很大改善:

这是清理之前:

>> memory

   Maximum possiblearray:             15 MB (1.622e+007 bytes) *

   Memory available for allarrays:    194MB (2.036e+008 bytes) **

   Memory used byMATLAB:            1549 MB (1.624e+009 bytes)

   Physical Memory(RAM):            4095 MB (4.294e+009 bytes)


   *  Limited by contiguous virtual address spaceavailable.

   ** Limited by virtual address space available.

这是清理之后:

Maximum possiblearray:            252 MB (2.641e+008 bytes) *

   Memory available for allarrays:    988MB (1.036e+009 bytes) **

   Memory used byMATLAB:             762 MB (7.991e+008 bytes)

   Physical Memory(RAM):            4095 MB (4.294e+009 bytes)


   *  Limited by contiguous virtual address spaceavailable.

   ** Limited by virtual address space available.


免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

相关文章
技术文档
QR Code
微信扫一扫,欢迎咨询~
customer

online

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 board-phone 155-2731-8020
close1
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

姓名不为空

姓名不为空
手机不正确

手机不正确

手机不正确
公司不为空

公司不为空

公司不为空