数据分析新手小白入门学习指南,这五大知识清单值得收藏
根据我从业这么多年的经验,如果为了尽快找到一份数据分析的工作,需要掌握三个核心的点:
- 数据分析基础(一定的数据思维、统计学基础和sql能力)——能做最基本的取数工作
- 数据分析能力(使用各种分析工具、套用数据模型、做可视化报表等)——能做简单的分析工作
- 业务分析经验(熟悉各种业务逻辑和指标体系)——能做复杂的业务拆解
因此对新人来说,强烈建议按照下面的学习路径进行学习:
1、数据分析常用的思维
判断一个人做数据分析的水平,不是看他学习了几种工具,最核心的差距在于思考问题的思维能,这是数据分析的本质,也是最容易被人忽视的点
常用的思维有很多种,下面简单举几个例子:
(1)细分思维:
比如某次考试小明的名次很低,如果他的父母不懂细分,一定会不由分说地训斥小明,根本找不到小明成绩差的真实原因。
而如果他们懂得细分分析,应该怎么做呢?应该将名次的维度转化为科目,然后分析每个科目的成绩,也许会发现小明只有某个科目没有考好,再针对这个短板采取相应的策略,这就是细分分析的思想。
(2)趋势思维
你可以简单地把趋势分析定义为对比分析的一种,一般来说是按照时间的维度,对某一数据或者不同数据变化趋势进行差异化研究,以及对数据的下一步变化进行预测。
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
(3)目标思维
我们在接到业务的需求之后,需要先想一下这个需求的真正核心目的是什么?
如果知道了业务目标,那么就可以把这样一个取数需求变成一个分析类需求,最终的交付形式就成了一份PPT,这样,就能避免成为取数机器。
(4)结构化思维
在面对这么一个问题时,结构化思维方法首先做的并不是立刻着手清洗数据。而是根据对业务的理解,先为数据分析画一个思维导图,它的作用相当于你来到一个陌生的城市拿出百度地图查询乘坐交通工具到入住的酒店的路线图。
事实上,结构化思维就是由麦肯锡提出的著名的“金字塔思维”,如下图就是典型的结构化:
(5)演绎思维、归纳思维
很显然,归纳是从个体属性出发,寻找因子之间的共性,总结出一个一般的特性;而演绎则相反,是从一般整体出发,寻找事物之间的逻辑,从而得到某个个体的特性。
2、统计学相关的理论与基础
(1)描述型统计
描述统计是我们做数据分析的主要基础,比如说销售人员说今年我们的销售情况很好,比去年要好很多。这不叫做描述统计,因为“比去年好”这个特点不是定量的数据
描述性统计里大概有三个分类:集中趋势、离散趋势、分布。集中趋势包含平均数、中位数、众数、分位数等,离散趋势包含极差、平均差、方差、标准差、分位差等,分布主要包含峰态分布和偏态分布
(2)推理型统计
也叫作推理性统计,他的目的是研究如何利用样本数据去推断总体数据的方法。他跟描述统计不一样,描述统计是用整体的数据来描述整体特征,推理统计是用部分数据来推理整体特征。我们经常说的假设检验、采样与过采样、回归预测模型、贝叶斯模型都是推理型统计。
二项分布:如抛硬币n次,不同正面朝上的次数对应的概率;
几何分布:如抛硬币n次,到第k次才取得第一次成功的概率服从的分布
泊松分布:在一定时间范围内发生概率相同,给定其发生的平均发生的次数μ,则事件在该事件范围内发生k次的概率服从泊松分布
(3)假设检验
假设检验就是通过抽取样本数据,通过小概率反证法去验证整体假设
(4)回归
回归分析的任务就是,通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
(5)聚类
聚类是根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分位一组,也就是'同类相同、异类相异”
3、快速套用的分析模型
(1)帕累托模型:
帕累托分析依据的原理是20/80定律,80%的效益常常来自于20%的投入,而其他80%的投入却只产生了20%的效益,这说明,同样的投入在不同的地方会产生不同的效益。
(2)波士顿模型
这个模型虽然是市场模型,但是其背后的逻辑却是数据分析,也就是矩阵模型。矩阵模型是双维度模型,你可以从两个维度出发对不同的指标进行定位,比如波士顿矩阵,即从两个维度对产品或者业务进行定位,也就是产品本身和销售的维度
(3)购物篮分析
购物篮模型的本质是关联,关联大家应该都很好理解,就是反映某个事物与其他事物之间相互依存关系的,在商品关联分析的定义是,通过对顾客的购买记录数据库进行某种规则的挖掘,最终发现顾客群体的购买习惯的内在共性
(4)用户流失模型
主要应用在两个方面:流失用户召回、现有活跃用户防流失,最常见的就是AARRR模型、漏斗模型等等。
(5)用户价值模型
业务分析,很多情况下都是要在资源有限情况下,去最大化的撬动效益,如何挖掘能创造最大价值的客户就是用户价值模型的工作。最常见的就是RFM模型、CLV模型、顾客社交价值模型。
(6)5W2H模型
所谓的5w2h其实就是针对5个W以及2个H提出的7个关键词进行数据指标的选取,根据选取的数据进行分析
(7)SWOT模型
分析法也叫态势分析法,S是优势、W是劣势,O是机会、T是威胁或风险。
5、常见业务场景
(1)经营类数据分析
对收入、销量等与企业经营活动相关分析,监控企业的运行情况,是为了发现企业运营中的问题,关注点是销量/销售额总体的时序变化、地区分布、变化原因
(2)用户数据分析
对购买额、购买频次、购买偏好等相关分析,目标是深入理解客户,关注点是用户画像分层、RFM模型衡量用户价值分层
(3)销售数据分析
定义是指销售收入、销售额、单价等与销售情况直接相关的分析,目标是完成销售任务,监控销售销量低的原因,提出解决方法,关注点是时序进度、落后原因、销售单产情况
(4)营销/市场分析
对企业营销/市场活动的投放、反馈、效果相关分析,目标是了解活动结果、优化活动计划、提升活动效率关注点主要集中在ROI相关指标