Minitab数据分布识别技巧

概述

  我喜欢所有数据,无论是服从正态分布的数据还是彻头彻尾很奇怪的数据。然而,许多人更钟爱于正态分布的对称钟形曲线。正如,理解带形状参数和尺度参数的Gamma分布不如理解带均值和标准差的常见正态分布那么直观。


  然而,生活中的一个事实是-并非所有数据都遵循正态分布。很多情况都是有异常的,非正态的分布。如何以易于理解的方式呈现非正态分布的实际意义对分析师来说是一个持续的挑战,这对于质量流程改进分析师来说尤其如此,因为他们的许多数据都是倾斜的(非对称的)。许多过程的输出通常在分布的一侧具有自然限制。例如,纯度不能超过100%。或钻孔尺寸不能小于钻头。这些自然界限会产生偏离自然极限的偏态分布。因此,非正态数据在某些领域实际上是典型的。


  虽然非正态分布很常见,但是大家也不要害怕。如果你可以使用一些工具识别它的分布,就会让它变得不那么可怕了。我会告诉你:

  • 如何使用Minitab识别数据的分



  为了说明这个过程,收集了92名中学女生的数据。数据包括她们的身高,体重和脂肪百分比,由Hologic DXA全身系统测量获得。

一、使用直方图初步探测数据分布

  直方图可以很直观的看出来数据的分布形状。





  这个直方图确实向我们展示了样本数据的形状,这是一个很好的起点。我们可以看到它分布偏向右边,可能是非正态的。但是,此图仅告诉我们此特定示例的数据(92名中学女生),你不能对全校女生做出任何推论。


  可以采取哪些措施来提高这些数据的实用性?首先,确定数据遵循的分布。一旦你这样做,你就可以更好的了解全体 - 你可以创建一些看起来很酷的图表!


二、如何识别数据的分布

  要确定分布,今天我们将会用到Minitab中的统计>质量工具>个体分布识别。这个方便的工具可以让您轻松地比较数据与14种不同分布(还包含两种转换)的匹配程度。它在会话窗口和图形中产生大量输出,但不要被吓倒。在我们完成输出之后,您需要了解3个关键输出。

Anderson-Darling统计量(AD):较低的AD值表示更好的拟合。但是,要比较不同分布与数据的匹配程度,您还应该评估p值,如下所述。

P值:你想要一个高的p值。通常有效的方法是比较分布之间的p值并使用最高的p值。低p值(例如,<0.05)表示数据不遵循该分布。对于某些3参数分布,p值无法计算,并用星号表示(AD 检验的 p 值只适用于 3参数分布中的Weibull 分布,其他3参数分布中的p值以星号显示)。

极大似然比P(LRT P):仅适用于3参数分布,低值表示添加第三个参数是对2参数版本的重大改进。值越高表明您可能希望坚持使用2参数版本。


  所以,对于当前的数据,我会像这样填写主对话框:




  让我们深入了解一下输出,首先从“拟合优度检验表”开始。




  第一行显示我们的数据肯定不是正态分布的,因为“正态”的p值小于0.005!(注意:我们是拿p值与0.05比较,这里正态分布的p值小于0.005,那它肯定要比0.05小)。


  我们将跳过两个转换(Box-Cox和Johnson),因为我们想要识别原生分布而不是转换它。


  一个好的起点是浏览p值并寻找最高值。最高p值用于3参数Weibull。对于3参数Weibull,极大似然比P是显着的(0.000),这意味着第三个参数显著改善拟合(用3参数的Weibull分布要比用2参数的Weibull分布好)。


  鉴于较高的p值和显着的LRT P值,我们可以选择3参数Weibull分布作为我们数据的最佳拟合。除了通过查看会话窗口中的“拟合优度检验”表来识别此分布,Minitab还创建了一系列图表,这些图表提供了大部分相同的信息以及概率图。


  概率图是一直观地识别数据遵循的分布的好方法。如果数据点贴近直线,则分布适合。您可以在下图中看到适合的3参数Weibull,以及其他三个不适合数据分布。


分析到这里,现在我们知道数据适合的分布是什么 ,接下来我们还要进一步识别分布的参数值是多少?如果你想知道这些,请查看Minitab会话窗口输出中的下一个表:




  现在我们知道脂肪百分比数据遵循3参数Weibull分布,其形状参数为1.68775,尺度参数为13.08486,阈值为15.28771。


  最终分析到这里,你可能会想,“这对我们有什么帮助?” 答案:有了分布的这些信息,我们可以超越原始样本数据,并对更多的学生进行统计推断。

免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空