更优、更快、更简 开启统计分析
您拥有的数据就像一把神秘的钥匙,可助您做出更明智的决策,更快捷地解决问题,更轻松地符合行业需求。
然而,要想用好这把钥匙,释放出数据的力量,您需要借助专业的工具。许多专业人士都有同感,Excel 已无法再提供您想要的分析工具,不能帮助您做出基于数据驱动的更优决策。
Minitab Statistical Software 是一个已得到行业认可的分析解决方案,值得您一探究竟,不要错过。全球许多要求极其严苛的行业和组织都将它用作基础工具包,以进行性能、质量和决策检验。
如果您的数据最初是在电子表格中创建的,例如使用 Excel 工作薄或 CSV 文件。现在,诚邀您体验 Minitab Statistical Software(登录官网,免费试用 30 天),简单几步,即可准备好并导入数据。
让我们开始吧。
Minitab 团队
准备就绪?导入!
让 Excel 数据进入 Minitab Statistical Software 的 3 种常用方法
01 复制并粘贴
您可以采用 Microsoft Office 用户都非常熟悉的直观方法将数据粘贴到 Minitab 中,例如,按 Ctrl+C 复制数据,再按
Ctrl+V 粘贴数据;或者,您可以右键单击后选择“复制”,再右键单击后选择“粘贴”。
如果您的数据包含单行列标题,或者没有列标题,则可以一次性快速复制并粘贴整个工作表。对于 Minitab,我们只
需要导入数据和列标题,无需其他项。
您可以在 Excel 中框选所有数据,再复制并粘贴到 Minitab 中;或者,您也可以先选择单行列标题并复制/粘贴,然后
回到 Excel 文件中复制每列的数据。
02文件 > 打开
数据量不大时,复制/粘贴非常适用;但若数据量较大,则建议您直接在 Minitab 中
使用文件 > 打开或者单击文件夹图标以打开 Excel 文件。
除了纳入您选择要包括的所有数据,您还会发现有一些其他导入选项可帮助您在导
入时组织数据,例如,指定要包括哪些工作表和行。在所需的文件上双击,可预览
Minitab 将如何导入您的数据。
Minitab 将尽可能按照需要的布局提供恰当的数据解释。这意味着:
• 只会有一行列标题
• 每个变量有单独一列
为了帮助您达此目的,预览窗口上提供了几个额外的工具。
转到选项... 以指定或调整:
• 数据范围(第一行,最后一行)
• 是否应选择列标题名称
• 数据中的“分隔符”(称为“字段定界符”)
• “文本识别符”和“小数分隔符”设置
• 列是否为“数值”/“文本”/“日期”
03 逗号分隔值
您还可以直接在 Minitab 中打开 CSV 文件(也称为“逗号分隔值”或“逗号分隔”)。
然而,并不总是用逗号来分隔不同变量的值。在下面的示例中,值由分号进行分隔。
在 Minitab 中打开该 CSV 文件时,左侧会显示该对话框。在字段定界符: 旁的下拉
列表中,将逗号更改为分号。
从 Minitab 中的预览可看到,数据的布局看起来已调整好。单击确定。
将显示一条注释,指出该文件已添加到当前项目中。再次单击确定,即可看到您的
数据已在新的 Minitab 工作表中以供使用。
预检列表
检查并修复数据以确保准确分析的 4 个地方
数据的性质决定了一个格式化错误可能会影响分析以及之后的决策。换句话说,凌乱的数据会浪费您的金钱。
还有一个费钱的方面是,您需要花费时间来检查并修复数据以避免这些错误。
在 Excel 中,这些错误可能并不是那么明显。而且,您可能不得不想办法运行一大堆公式或者执行“查找并替换”步骤以修复问题;或者,您可能甚至不得不一次一个单元格地手动纠正错误。
下面,我们分享了几个主要的步骤,可帮助您在
Minitab 中格式化、检查并修复数据,以确保执行准
确的分析。
01 正确组织数据结构:列与单元格格式
Excel 通常看起来就像是一张白纸。用户可以在顶部写入标
题,在一侧绘制图形,在底部添加汇总行(例如“合计”),
操作简便快捷,生成的数据集看起来更像是一个笔记簿或报
表。它可以采用任何格式。
要想准确分析数据,妙方就在于按以下要求组织数据结构:
• 为每个变量提供一列
• 在单独一行上提供列名称
02 确保每一列的数据量相同
您要分析数据以调查各个变量之间的关系。对于大多数分
析,包含变量的列应具有相同数量的单元格。
Minitab 可帮助您检测出是否存在某些列的数据偏多或偏少
的情况。单击数据 > 工作表信息。
在显示的概览中,您可以直观地看到每一列有多少数据以及
哪些位置存在数据缺失。在右侧的示例中,您可以看到,大
部分数据列的计数为 57,而 Age 和 Weight 只有 50。还有
一些列具有“缺失”信息。
对于数字数据,在列的最后一个单元格填入一个星号 (*),
Minitab 将自动回填上面的行(不要填入零,因为零会被解
释为“无”而不是“没有数据”,将会影响计算结果)。
对于文本数据,找到最后一行并填入一个空格而不是星号。
Minitab 随后会将它重新分类为“缺失”。
03 查找并修复大小写不匹配问题
分析文本数据时,非常关键的一点就是,数据中的字母大小写需保持一致。
为什么呢?以单词“tree”为例。如果您的数据中既有“tree”也有“Tree”,这种
大小写不匹配的情况将会导致它们被分别计数,您甚至可能根本未注意到这个问题
就拆分了数据集。
在 Minitab 中,您可以执行快速计数来找出大小写不匹配的情况。
1. 选择统计 > 表格 > 单变量计数。
2. 在变量中,输入您要检查大小写不匹配的列(本案
例中为“Region”)。单击确定。
在该输出表格中,罪魁祸首就是单词“tropical”出现了
大小写混用的情况。
要修复此问题...
1. 转到数据 > 重新编码 > 到文本。
2. 在重新编码以下列中的值中,输入存在大小写不匹
配的列(“Region”)。
3. 在方法中,选择重新编码单值,并更改值以使它们完全相同。
4. 在已重新编码列的存储位置中,选择在原始列中。单击确定。
在导入过程中修复问题
1. 使用文件 > 打开,从文件系统中选择 Excel 文件。
2. 单击标题为 Data(原始 Excel 文件中包含数据的工作表的名称)的标签。选择数据具有列名称。
3. 单击选项。在文本列中,选择纠正大小写不匹配。
单击确定两次。
04 删除数据开头或结尾处的空格
前导空格和尾部空格就像您房间内的白蚂蚁。如果您没有意识到它们的存在,未清
除它们,它们将会让您的数据集“千疮百孔”。
要修复此问题...
1. 选择计算 > 计算器。
2. 在将结果存储在变量中选项内,输入一个空列或者选择覆盖现有列。
3. 在函数中,双击 TRIM 和CLEAN。单击确定。
设置默认值
再次强调,预防问题优于修复问题!正如处理大小写不匹配问题一样,打开文件
时,除了纠正大小写不匹配,还可以选中去除不可打印的字符和多余的空格;或
者,您也可以按照以下步骤操作,以便在将来所有文档中修复这些问题...
1. 转到文件 > 选项。
2. 在左侧窗格中,单击打开。
3. 选中去除不可打印的字符和多余的空格和纠正大小写不匹配框。
4. 单击确定。
Minitab Quick Start 是基于 Web 的电子学习指南,可帮助您快速了解Minitab Statistical Software 的基本功能,并提供了功能导航。
开始使用 Minitab 分析数据,从数据中获取洞察信息,为您面临的颇具挑战性的业务难题找到解决方法。
通过 Minitab Quick Start,您可以了解如何使用 Minitab 的关键功能、组织您的数据和结果、从 Excel 和其他源导入数据、创建数据可视化、执行统计分析以帮助做出数据驱动的决策,等等。
让我们开始吧。