在Excel中进行预测,比你想象的简单——预测人口变化趋势
进行业务数据分析时,预测是一个重要的课题。很多人会把预测当作一个很高深的内容,因此会望而生畏。实际上,在Excel中做个预测简单的超过你想象。
当然,针对不同的场景和实际状况,需要采用的预测方法有很多,预测中也确实包含一些对大多人来说很陌生的内容,如果有必要,我会另文为大家介绍。
01
数据和任务
为了介绍今天使用的方法,我采用了过去30年的中国人口数据(1990-2019)。这份数据来源于国家统计局网站(http://www.stats.gov.cn/tjsj/ndsj/2020/indexch.htm):
这里的数据是统计年鉴数据,是图片格式。网站其他位置有表格格式的数据
经过下载整理,我们得到了下面的表格:
现在老龄化是个很热门的话题,我们预测一下中国的老龄化人口会如何变化!
02
分析老年组人口的趋势
统计数据中人口按照年龄结构分为了3部分:
14岁以下
15-64岁
65岁及以上
为了简化,我们分别用少年组,青壮年组和老年组指代这3部分人群。
尽管随着时代的发展,在很多人的认知里,65不能完全算作老年人。但是现在的统计口径和传统观念中,65岁还是被当作老年人的。我们先看一下这个当前数据的人口趋势:
从图表中可以看出,自1990年之后,这个老年组人口是逐渐上升的的趋势。当然,这个趋势可能是因为总人口上升造成的。所以,我们应该观察一下,这个老年组人口在总人口中的占比。因此,我们在数据中添加了两列,分别计算每一年度的总人口,以及老年组的占比:
再来看这个老年组占比的趋势:
占比的趋势跟老年组人口数量的趋势基本上是一致的,都是逐步向上的,我们可以说老龄化程度是越来越强的。那么这个老龄化会强到什么地步呢?这个就需要预测了。
02
预测老龄化人口变化
在预测之前,我们必须首先强调三点:
预测数据只能作为决策时的参考。预测的准确率依赖于预测方法的选择,在数据分析的理论中,有很多预测方法可以使用。但是不同的预测方法得到的结果各不相同,有时相差还挺多。
而即使你选择了“正确”的预测方法,最有参考价值的也是最近几期的预测数据。越是远期的数据越不准。不能让你的数据无限外推,因为造成数据变化的本质原因可能已经发生了改变。
本文的目的是为了介绍在Excel中如何进行预测,并没有对选择合适的预测方法做深入研究,所以这个预测结果不能用作任何参考。
下面,我们就来介绍一下在Excel中最简单也是最强大的预测方法。
选中数据区域任意单元格,在数据选项卡中,点击“预测工作表”:
弹出了一个对话框:
这里展示的就是一个预测结果,从图上看,是对青壮年组做的预测。我们可以点击选项,进行设置:
这里左下角的置信区间是一个统计名词,粗糙的理解就是预测的数据在多大程度上可靠。季节性是数据序列数据的一个特性,我们会在后续的其他文章中为大家介绍。
点击确定,就得到了预测结果:
这个预测功能创建了一个工作表,将历史数据和预测数据都放在了这个表上,并且创建了一个预测图表。
Excel中的这个功能使用的是指数平滑法进行预测。实际工作中进行预测的方法有很多,比如对于季节性特别明显的数据采用周期预测方法,大部分实际序列采用的移动平均法,有明显指数特征的曲线法,对于历史数据不足的蒙特卡洛法。对这些预测方法,在Excel中都有相应的支持。
如果大家觉得有必要,我们可以在后续为大家介绍这些预测方法。请大家在本文后面留言,说明你希望了解哪种预测方法。