解释概率图的主要结果
请完成以下步骤来解释概率分布图。主要输出包括 p 值、拟合分布线和估计的百分位数。
关于本主题
步骤 1:确定数据是否不服从分布
要确定数据是否服从分布,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表示当数据实际上服从分布时,判定数据不服从分布的风险为 5%。
P 值 ≤ α:数据不服从分布(否定 H0)
如果 p 值小于或等于显著性水平,则决策为否定原假设并得出数据不服从分布的结论。
P 值 > α:无法得出数据不服从分布的结论(无法否定 H0)
如果 p 值大于显著性水平,则决策为无法否定原假设,因为没有足够的证据得出数据不服从分布的结论。但是,您无法得出数据服从分布的结论。
在这些结果中,原假设声明数据服从正态分布。由于 p 值为 .463,大于显著性水平 .05,因此决策为无法否定原假设。您无法得出数据不服从正态分布的结论。
警告
样本数量影响检验功效。极小的样本可能会因功效不足而无法从分布中检测到显著的偏移。极大的样本可能因功效太大而从分布中检测到不重要的小偏移。因此,使用概率图上的直观结果以及 p 值可评估分布拟合,如步骤 2 中所示。
步骤 2:对分布的拟合程度进行可视化处理
检查概率图并评估数据点与拟合分布线的服从程度。如果指定的理论分布能够很好地拟合数据,则点将沿着直线紧密分布。例如,下面的正态概率图上的点沿拟合线分布。正态分布似乎能够很好地拟合数据。
注意
拟合分布线是图中间的直线。图上的外层实线是各个百分位数(而不是整个分布)的置信区间,不应当用来评估分布的拟合情况。
步骤 3:显示总体估计百分位数
在 Minitab 中,将指针放在拟合分布线上可查看百分位数和值表。
例如,下面的概率图显示检验对象在跑步机上走步时的脉搏率。对于均值和标准差等于该数据的正态分布,预计总体中有 5% 的脉搏率为 54.76 或更少。
注意
只有当数据紧密服从分布时,估计的总体百分位数才准确。
获取概率图点的方法
概率图通过根据其估计累积概率标绘每个观测值(包括重复的值),从样本创建估计的累积分布函数 (CDF)。
Minitab 通过使用以下公式之一,根据在文件 > 选项 > 单个图形 > 概率图中选择的内容(默认情况下选择中位数秩)计算估计的累积概率。对于每个公式,使 n 等于观测值个数,使 i 等于每个观测值的秩顺序,这样 i = 1 表示最小值,而 i = n 表示最大值。
中位数秩 (Benard)
均值秩 (Herd-Johnson)
修正后 Kaplan-Meier (Hazen)
Kaplan-Meier
注意
Kaplan-Meier 方法导致最大观测值的 p = 1。由于所得到的值不能用在图中,因此 Minitab 改为将最大的 p 计算为上一个 p 与 1 之间距离的 90%。
拟合分布线表示具有所指参数(估计参数或历史参数)的所选理论分布的 CDF。如果未提供历史参数,则 Minitab 将使用最小二乘估计(正态分布或对数正态分布)或极大似然估计(其他分布)来估计参数。
Y 值(在某些情况下是 X 值)将变换,以使拟合线为线性。但是,刻度标签始终与未变换值保持一致。因此,当所选分布与数据达到完全拟合的程度时,标绘点形成一条直线。
下表显示了对每种分布使用的变换。
重要信息
如果标绘未针对阈值调整的数据,则分布拟合不是由直线表明。
表示法
项说明数据观测值的数据值In(x)x 的自然对数
(p)标准正态分布的逆 CDF 为 p 返回的值。G-1(p),kGamma 分布(形状 = k 且尺度 = 1)的逆 CDF 为 p 返回的值。除非输入历史值,否则 Minitab 不会使用估计的形状参数。
免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删