Excel太烦、python太难,我用它就能轻松搞定数据可视化
小李在一家连锁超市企业的IT部门,经常要帮业务部分做数据分析,公司信息化建设发展比较落后,IT部门也只有两个人,各种各样的数据表经常让小李加班加到头疼,每次辛辛苦苦做好的分析报告,老板还总嫌丑。
众所周知,超市的数据量十分的大,而且是实时变动的,小李平时做数据分析都是用的Excel,处理一些小数据量的数据很方便,但一碰到大数据量就会卡死,更别说实时更新数据了,而且用excel做一些复杂可视化步骤十分繁琐。
就拿一个简单的综合分析仪表板来说,用 Excel做就需要用到表格函数、AVERAGEIF函数、INDEX函数、MATCH函数等十几个函数,以及堆积条形图、簇状柱形图、信息图、带数据标记的折线图、簇状条形图等几种图型,就算是熟练excel的也要做上半个小时。如果涉及到数据地图、图表联动、钻取等复杂可视化,还要用到数据透视表、VBA。
很多热爱算法的朋友会用python或R来做数据分析和可视化,Python包含很多强大的统计学和数学工具,比如Pandas, Numpy, Matplotlib, SciPy, scikit-learn等等,Matplotlib库包含丰富的可视化图表,R的可视化功能也很强大,但对于代码基础差的人来说,要短期上手比较困难。
其实现在市场已经出现了不少专业可视化分析软件,数据处理和分析流程都比较方便,国内比较有名的有国产的FineBI和国外的tableau。就拿我熟悉的FineBI来说,它的定位是一款自助分析软件,不需要编程和函数,拖拽数据字段就可以自动生成图表,而且内置了丰富的高级可视化图表,对大部分数据分析师来说是不错的选择。下面我就用FineBI来给大家简单做个超市运营数据分析仪表板。
下载安装
FineBI官网下载安装后,输入激活码激活,个人版是永久免费的,登录之后,就可以打开到这个页面。
数据链接导入
点击数据准备,新建数据连接,输入用户名和密码,链接数据库
添加业务包,把已经准备好的数据导入,可以直接添加sql数据集或者Excel数据集,我们把超市运营数据导入。
数据清洗加工
数据导入好了,下一步就是清洗数据,然后根据分析指标进行数据处理,这一步用Finebi做十分方便,它提供了自助数据集的功能,可以对数据进行过滤、分组汇总、新增列、字段设置、排序等操作,而且采用的是步骤式的操作,比较符合我们的思维习惯,每一步都可以增删改。
添加好数据表后,选择我们分析要用的字段,然后根据我们的分析指标,进行求平均、分组求和等一系列的计算。
先求出每个订单的配送时长(利用公式:到货日期-发货日期),然后将同一地区的数据进行汇总,可以得到每个地区的总订单数和总时长,再拿总时长/总订单数,就可以得到平均每个地区的配送时长。
详细的步骤我就不再赘述,按照我们的分析指标准备好要用的数据集:
数据可视化分析
建立好自助数据集之后,就要对数据进行分析了。创建仪表盘,把分析字段拖入横轴、纵轴,就可以自动生成图表。
比方说我们要做一个地区平均配送时长和订单量分析,把地区拖入横轴,将时长和订单数拖入纵轴,即可得出:
在图表选择的时候,FineBI可以根据的拖入的纬度和指标智能推荐合适的图表,对于一些数据分析新手来,省去了纠结图表选择的难题。
接下来新建图表组建,用同样的方式将其他的分析图表做好,在仪表板上自由布局,这样一个简单的仪表板就完成了,过程中完全不要一行代码。
除了这样简单的仪表板制作,FineBI还可以实现更加炫酷高级的可视化效果,比如像下面的这种: