做数据分析要注意些什么?
寻找数据、整理数据、分析数据、可视化数据……怎么都跟数据有关?数据分析师在今后的工作中,大都是与数据打交道。那在做数据分析要注意些什么?你可以从以下的几个方面考虑:
在做数据分析要注意些什么?
1、检查并清理异常数据。
数据分析师必须确保收集到的数据是有意义的。以金融行业的交易数据为例,某企业的年交易金额在一般情况下为200万,但是数据显示的年交易金额竟然达到了2亿。很显然,这可能是一条有问题的数据。问题可能是输入错误,也有可能是当年增加了其他业务收入,或者增加了营销收入等等。如果数据分析师不能及时发现,并确认问题发生在哪个环节,那么,可能会因此导致后续工作都出现问题,甚至严重影响企业的效益。
2、检查定义是否更改。
前段时间,中央开展了第七次全国人口普查登记工作(PS:小编有积极配合中央大大的工作哦~)。我们就以人口普查的数据为例,如果有人在今年构成了严重的刑事犯罪,那他数据的定义一定需要被改变的。作为数据分析师,一定要检查定义是否有更改。
3、仔细考虑样本偏差。
比如,政府想要进行一个有关公共交通的研究:人们更喜欢哪一种出行方式(大巴、飞机以及火车等)。如果政府选择在火车站附近进行调查,那很大概率上会导致得到的样本有很大的偏差。因为,大部分人来火车站就是为了乘火车,不然谁会浪费时间来火车呢,对吧?~
4、考虑数据与数据之间的关联。
举一个简单的例子,美国是世界经济强国,也是旅游大国。但是2020年,由于疫情的影响,去美国旅游的人数大幅下降。“疫情”与“旅游人数”之间,就存在关联性。
5、了解统计信息。
数据分析这一工作,有时候会需要好几个数据分析师共同完成。因此,你需要指出哪些数据是重要的,哪些数据是不重要的,让大家有侧重地去分析。
6、选用适当的工具
实际上,只要你选用的工具能够更好地进行数据分析,这个工具就是好工具,不管是R还是SAS都可以进行数据建模。同样,不管是Quikview还是Tableau都可以进行可视化。这就好比我们选择耳机,有人就喜欢蓝牙耳机,因为它没有拖拖拉拉的耳机线;而有人就喜欢有线耳机,因为它不用反复充电。
写在最后
以上这些就是做数据分析要注意些什么?作为数据分析师的你在工作中有注意这些嘛?