对于我们平常的数据分析来说,借助统计工具(如Minitab)很容易得到分析结果。但即使是一位统计分析老手,在做统计分析时也会面临一件很头疼的事情—数据清洗。
对于怎么把数据导入到Minitab中,我们之前有个小调查,结果显示仍然有大部分朋友是从Excel复制数据到Minitab中。
在数据量小的情况下,上面的这种方法确实要比复制粘贴来的快。但是,如果您的数据不是在Excel中开始,将其存入Excel再导入Minitab并不一定是最好的选择。因为Minitab本身就可以轻松处理txt,dat和csv等格式的数据。
例如,参考最近一项关于使用可穿戴传感器来测量人类受试者从坐姿到站姿的移动程度的研究结果。数据以csv格式公开提供,但有一个有趣的转折点。虽然csv传统上代表“逗号分隔值”,但此数据集使用分号作为不同变量中值之间的分隔符。
如果您在Excel中打开此数据集,您将得到如下内容:
因为所有数据都在A列中打开,所以如果你要拿它们来做分析你还需要做一些处理。您可以将所有分号更改为逗号并重新打开数据集......但它无济于事。您可以编写公式来自己分隔列,但每个变量至少有1个公式(此数据集中有30个变量)。
但是,如果您计划在Minitab中分析数据,则无需在Excel中修复数据。在Minitab中,您只需要确定数据是否具有列名以及值分隔符是什么。
转到Minitab,点击文件>打开并选择您的CSV,然后您将看到如下对话框:
在“字段定界符”中,把“逗号”改为“分号”。
点击“确定”后,你将看到下面提示,继续点击“确定”。
我们将在Minitab的工作表窗口得到以下数据集格式。
在这种情况下,Minitab为您使用的数据提供了比Excel更多的灵活性。一旦您的所有数据都在正确的列中,您就可以开始分析,帮助您做出更好的决策。Minitab确保您的数据在几秒钟内就绪。
免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删