现代IE在萌芽(5)--- 给我一点数据!

上次我们讨论了头脑风暴的结果,一个是从结算效率本身出发,但是中间的复杂因素导致模型异常复杂;另一个是换了角度从财务出发的,但是转化之后干扰因素过多和测量周期难以确定。

这也不行,那也不行,那么我们怎么办呢?

这时候,我们应该有一些数据来支撑、验证大家上面的想法、我的评论了。

于是,超市经理找了一个工业工程大四的实习生,在现场采集了一些数据。包括:

1、每个订单(顾客)结算时间 (可以从扫描第一件,到收据打印完毕作为单笔时间)

2、每个订单中的总金额(收据上有)

3、每个订单中商品数量(收据上有)

4、每个订单中商品体积总大小(可根据收据上面商品名称分为 小、中、大,然后做转化,中 = N*小;大 = M*中;或者为了更高准确度,您可以将小中大再细分:很小,小,小中,中,中大,大,很大)

接着,我们就可以看到金额、商品数量、体积和 单笔订单结算的时间的关系了。可能是这样的散点图中的一种:

如果是第一种,那么就是正相关,我们假设:金额、商品数量和单笔结算时间的关系很可能是这种关系(越成一条直线关系越强,越散乱越弱)。

如果是第二种,那么就是不相关,我们假设体积不相关。

第三种是负相关。

好了,假设到了这里我们验证了两种种因素都有关系,这样就较为明朗了,将强相关的给予比较高的权值,将弱相关的给予比较低的权值。接着我们就是要将这样的公式

T = A*(散点图拟合斜率* 商品数量 + N1)+ B*(散点图拟合斜率* 金额 + N2)

约束条件(A+B=1,A>B,A>0,B>0)

带入上述公式,让电脑进行遍历。找到T的分布和原采集数据分布差异最小的一组(a,b)。那么这个就是最合理的权值了。

如果是粗略的应用,那么直接根据二八原则,可以粗略的给出a = 0.8,b = 0.2。即可

但是做这些的前提就是需要一点数据,来验证之前的大家的头脑风暴,也用来验证我的评论。谁对谁错,也就一目了然啦。用数据说话。

(0)

相关推荐