探索性数据分析的第一阶段——推测
数据分析的目的是用各种方法将数据转化为信息,使数据变得有意义。但是这种转化并不那么简单,尤其是对六西格玛团队而言,面对的问题是非常复杂的,牵涉的原因是多方面的。数据分析应该分为三个阶段:推测阶段、提出关于原因的假设阶段、证实或排除原因阶段。下面分别加以叙述。
为了能进行有效的推测,首先要学习数据分析的原则,然后学习些简单分析工具,最后学会一个重要的六西格玛工具——多变异图的分析工具。
数据分析原则要时刻牢记三个要点,这会帮助你理清思路并有效地进行数据的分析。
1、明确要深入了解的方向
在工作中存在着大量数据,它们很容易让你觉得无从下手。正确的做法是经常重新翻看项目特许任务书和问题陈述,时刻牢记团队的目标。只有这样才能牢牢抓住分析的大方向。
2、不断提出假设
有很多方法可以分析数据,如果不当心的话,六西格玛团队很有可能在摸索方法上浪费很多时间。较好的方法是,先结合团队任务做出一个假设,这会帮助你决定如何分析数据。例如:
假设:餐馆的顾客抱怨增多是来自新的、不熟练的服务生。
分析方法:把顾客抱怨数据分成两组——来自新服务生招待的顾客和来自有经验服务生招待的顾客,寻找两组数据的系统差别。
注意:要充分接受“假设是有缺陷的”这种可能性,不能视而不见那些与假设不符的数据。有经验的数据收集者知道,事实上,在最开始阶段,他们的绝大多数假设都会是有缺陷的。但是,正是认识到要注意不断改进缺陷,才帮助他们最终确定出正确的假设。
3、注意关于事件发生的频率、影响程度以及与问题缺陷症状相关的问题
如果把调查局限于一个假设或一个问题,你甚至都不敢肯定是否抓住了正确的问题。较好的方法是提出更多问题,通过分析找到其中最重要的问题。以下是上述餐馆六西格玛团队可能提出的一些问题:
①新服务生招待的顾客是否比其他顾客抱怨得要多些?(问题频率)
②新服务生招待的顾客抱怨什么?与有经验服务生招待的顾客抱怨相比,有何不同?(观察到的问题)
③如果新服务生招待的顾客抱怨得更多,是否意味若这些顾客将不太可能重新光顾?(问题的影响)
④团队需要对问题有深入的了解,以便合理地决定究竟应该把时间花在哪里,解决方案在哪里,如何实施解决方案;否则,你很有可能浪费三个月时间解决一个不常出现或对顾客没什么影响的问题。
运用这些原则将帮助你使团队的数据收集工作紧紧围绕如何发现问题根本原因来进行。你可以依据这些原则来利用你在渊量阶段识别和收集到的分层数据。对于刚才提到的餐馆,六西格玛团队需要把关于抱怨的数据分为“新的”和“有经验的”服务生,以开展分析。