极简数据分析法:如何用数据视角洞察真相
对职场精英而言,「事实」永远比「主观判断」更重要。
「数据分析」能力俨然已是当下各行各业精英的标配能力。
那么,数据分析到底为何物?我们又该用数据之眼洞察真相,进而以「数据驱动增长」?
本文,李少加将以「公众号数据分析」为例,无论你是否为运营人,都将从中获得全新的数据思考视角。
如果说,去年下半年起,广大公众号运营者就已经嗅到丝丝寒流,那今年以来,则可说是暴风雪前夕——大量公众号出现各种退化现象(不妨翻下一些公众号历史数据即可发现):
粉丝量明明还在增长,整体阅读量却下降
粉丝量虽在增长,但增速明显变慢、停滞
以往屡试不爽的吸粉活动好像效果也微乎其微
……
顺其自然?当然不。
在当下商业竞争的丛林世界中,「胜利」永远只有一个标准:比别人跑得「更快」。
因此,革新、自我进化永远都是唯一的出路,一种生存常态。
对,这就是拙作《进化式运营》书名的由来
但是,问题来了。
当我们努力进行各种内容革新,比如定位调整、内容层次优化、内容创新、活动升级等等时……
究竟怎样才能知道「改变」究竟是变好了、还是变坏了、还是不温不热?
也许你想到答案了:从公众号后台数据的蛛丝马迹中捕获「真相」。
对,就是大家平常用来“看粉丝增了多少、看阅读量、看转发量、收藏量”然后就好像再没啥作为的公众号后台的那一小丢丢“数据”。
这个“利用数据洞察真相”的行为,江湖人士往往美其名曰:数据分析。
然而,这个称呼李少加认为极具误导性。
因为,数据的真正用法不是分析驱动,而是「设计」驱动。
下面,在正式进入公众号数据分析前,我们不妨先花3分钟时间科普个数据分析的正确用法:
一、数据分析的科学姿态:设计模型在先,分析结论在后
从运营视角来看,本质上,所有的“高阶运营”无非只做两件事:
当运营数据的增速满足目标时,则做提升运营效率的工作:比如,让运营过程流程化、标准化,以此提升效率
当运营数据不满足目标或想进一步提升增速时,则做提升运营「效度」的工作,比如,持续“采纳新的运营策略”,并「快速验证」策略的有效性
PS:提出新的创造性运营策略即是对李少加上篇推文为何你很擅长解题,却从未学会解决问题?“假说思考法”应用,有兴趣可参阅
在当下以及未来漫长的时光里,绝大部分公司,尤其是身处互联网丛林深处的运营人士,更需要做第二类事情:
提升运营效度——即不断通过数据验证运营创新是否可行。从而比对手跑得更快,比昨天的自己跑得更快。
这才是数据的最大用武之地:验证新策略的有效性。否则任何运营创新无异于闭着眼睛上战场,瞎打一通。
注意:本文所指的数据是特指企业内部的“小数据”,它与目前市场火热的大数据概念有着本质的区别,切莫混淆。
由此,我们不难推测,数据的标准用法从来就不是:攀比谁的算法牛逼,谁的工具装逼,更不是比谁的可视化效果漂亮……
数据的标准玩法应当具备下述简单清晰的5个步骤:
声明:由数据挖掘跨行业标准过程CRISP-DM演化而来
1.确定你想验证的核心指标
2.设计一个能够验证该指标变动的可靠数据模型
3.实施新的运营策略
4.收集测试前、测试后的环比周期数据
5.将数据代入模型公式中进行验证
由此可见,所谓公众号“数据分析”的第一步,应当是先问自己一个更底层更核心的问题:
于公众号运营而言,我们真正该关心的数据指标是什么?
然后再基于这个核心指标去“设计数据验证模型”。
对于不同行业、不同战略地位、不同变现模式的公司,其公众号运营核心指标往往是不同的。
但整体而言,李少加在拙作《进化式运营》中曾提出的公众号商业价值公式:
公众号价值 = 活跃用户数 * 对用户影响力 * 用户质量
此公式中提到的三大核心指标对所有公众号运营无疑都是极端重要的。
对公众号价值公式的剖析有兴趣亦可参见「少加点班」的历史推文:公众号运营精要:从原创到独创,从低价到无价
下面,又到我们的示例时间。
李少加将依据上述公众号商业价值公式的核心指标作为目标,示例3个数据验证模型,抛砖引玉。
知悉这个思路后,后续各位可自行根据你们的运营情况灵活的设计各种数据验证模型,进而科学的判断:运营策略究竟是变好还是变差了。
二、公众号数据分析之:对用户影响力指标的验证
一个显而易见的事实是:
一个公众号商业变现价值的质量取决于“公众号对其自身粉丝的影响力”。
但是,“对他人影响力”这个指标非常笼统,我们该如何设计数据验证模型呢?
我们可以从忠诚粉丝行为的蛛丝马迹中捕获相关数据。
一般一个公号忠诚粉丝最典型的行为有哪些呢?我们运营方能看到的,那必然是:
打赏
好评留言(即不包括吐槽、中性留言)
李少加在「少加点班」公众号进行过为期一年的统计:上述两类粉丝的掉粉率是整体掉粉率的1%左右,充分证明,将其作为“忠诚用户”的参考变量是靠得住的。
当然,具备批判性思维的你可能会问:
这种统计方法岂不是忽略了“沉默的忠诚用户”(即虽然背后默默支持,但既不打赏也不留言)?
李少加在设计之初考虑到这个问题了。
答案是:对于同一个公众号而言,从行为学的角度来看,“发声的用户”其比例整体是趋于稳定的。我们的目标只是验证前后不同的内容策略哪种效果「更好」,因此,对于相同维度的统计指标,其误差几乎可以忽略不计。
那么,还有哪些参数能够作为评估“公众号影响力”的指标呢?
另一个参数则是每篇推文的“收藏量与阅读量的比值”。考虑到「运营效益最大化」原则,李少加认为,前面两个参数已经能充分反映出内容策略究竟是否变好了,因而这个参数可视为备用指标。
那怎么统计这两个参数呢?
打赏人数很容易统计,后台直接可以查到,统计一个时间周期的打赏人数即可,而“正向留言”的用户数,因为需要主观判断,李少加在拙作《进化式运营》中抛出的思路是:
利用公众号后台的“标识功能”对用户进行标识处理,进而可以在“用户分析”栏中找到统计数据。
比如下图评论则显然是一个正向留言:
而我们只需要在公众号后台用鼠标移动到该粉丝名上,在弹出的标签窗口中点击下图所示出,打上标签即可:
下面做个简单示例:
假设我们在4月份对公众号内容主题进行了微调,然后想知道新的定位跟旧的定位谁更好,那么,我们就可以:
在定位微调前抽取某一周的数据;
在定位微调后抽取同一周期的数据;
当然,调整的这两周尽量要避开大假期、或其他相关大事件的影响。
将两周数据汇总到下表,示例如下:
至此,我们可以简单依照下述模型公式分别计算下调整前、后,各自一周的“影响力数值”:
我们可以设计一个简单的量化公式,如下:
新增影响力指标 = 留言粉丝*权重 + 打赏粉丝*权重
建议打赏粉权重适当高点(愿意用行动说话的更靠谱),比如1.5,而留言粉权重为1。
这就转化成小学数学问题了,套用上述计算下:
调整前,一周的影响力指标=192*1 +92*1.5=330
调整后,一周的影响力指标=357*1+248*1.5=729
由于调整后这段时间还受到粉丝自然增长的正面影响,因此建议对调整后的影响力值(729)再扣除掉约2%的正向影响。
因此,修正后的调整后影响力指标约为:729*98%=714
整体影响力之差约为:714-330=384,这相比调整前一周的影响力(330),足足提升了116%,充分说明了内容定位调整后的正确性。
当然,这个模型、公式、权重等都非常灵活,毕竟我们的目标是「对比」,而不是深究量化的指标精准度问题。
养兵千日用兵一时,养成标识用户的好习惯,关键时刻就知道它的重要价值了。
上述的“对用户影响力”指标的数据验证模型主要适合的情况有:
内容定位调整
内容风格调整
商业化变现前后(即验证变现行为是否伤害了忠诚用户的感情)
下面,再示范下另一个公众号的核心指标:用户活跃度应该怎么验证
三、公众号数据分析之:用户活跃指标的验证
时下稍微有点脑的投资人在评估公众号价值时都会参考「用户活跃率」。
因此,在运营公众号过程中确保活跃率是否健康、是否持续提升就尤为重要了。
那么,我们应选取哪些指标作为用户活跃的考虑参考因素?
是常见的阅读数、点赞数、打赏数、收藏数、还是转发数、留言数?
李少加认为,以上都不是。
实际上,有参考价值的因子无非只有三个:
阅读完整率,即阅读完文章的人数与阅读总人数的比值;
普通留言比率(剔除掉负面留言),即当天留言人数与阅读总人数的比值;
点赞比率,即当篇文章点赞人数与阅读总人数的比值(阅读完的人才会发生点赞行为);
我们只需分别统计一个周期内,上述指标各自的「均值」即可。然后彼此独立与前一个周期的同一指标对比,看看是否三个指标各自都有所增长,彼此交叉验证。
当然,为显著提升数据差异,用累积平方和之差再开方也行。李少加认为,我们的目的是对比哪个内容策略更好,只要能够比较即可,故均值就能满足要求。
下面进行示例。
假设某位姓马的老板投资了「少加点班」,于是我公众号在4月份将内容层次整体提升了一个水平,然后我们想验证下这种高水平的内容是否更符合用户对内容的偏好,于是,我们同样抽取四月份跟三月份的某一周的数据进行对比:
我们先统计下每篇推文留言比率的变化:
从上表可以看出,内容提升后留言平均比率比之前的变化幅度:
(2.8%-1.8%)/1.8%=55.5%
提升率超过了50%,这初步说明内容层次提升对用户活跃起到了明显的成效。
紧接着再看下每篇推文点赞比率的变化:
从上表可以看出,内容提升后点赞平均比率比之前的变化幅度:
(2.2%-1.5%)/1.5%=46.7%
提升率将近50%,交叉验证了上述留言比率数据并无异常,亦说明内容层次提升起到了明显的成效。
最后,我们再看下阅读完整率是否因为内容质量提升而有所下降(毕竟这年头曲高和寡的现象广泛存在)
这时候,有经验的运营人可能会问,公众号后台哪有阅读完整率的数据啊?
嘿嘿~这时候我们就可以利用“流量主”功能啦,流量主里面的“曝光数”几乎就等于完整阅读完文章的人数了。
之前个别人对我放开广告的行为表示不解,我目的是为了统计阅读完整率,仅此而已。
当然,如果你的公号暂不具备开通广告展示功能,亦可以在文章末尾设计一个简单的投票,变相获得阅读完整率。
比如,可以询问“觉得本文对你收获大么?”通常阅读完的人都会顺手投个票,哪怕存在前述的“沉默用户”,于「对比」而言,对两个周期的影响是一致的,因而依然可行。
通过上表数据,我们可以简单计算出,内容提升后阅读完整率的均值比之前的变化幅度:
(35%-33.3%)/35%=4.8%
可见,尽管内容档次提升了,但公众号阅读完整率依然保持了将近5%的提升,这初步打消了我们对“阳春白雪曲高和寡”的忧虑。
综合上述三个参数均值的提升幅度而言,我们基本上可以做出决策:
此次内容策略的提升是值得保留继续的,后续要做的就是在新内容的基础上持续提升内容的产出效率。
好奇的朋友可思考下:
此处为何采用「比率」而不直接用「数值」;又为何不将「转发比率」纳入参考因子中,想不透的可在「少加点班」后台回复“答案201704”即可查看。
通过这两个例子的分析,相信各位已经对“如何善用公众号后台数据”有个强烈的认知了。
前面谈的都是基于“新的内容策略”对公众号核心指标是“变好还是变坏”的验证,属于大刀阔斧的动作。
但是,现实中我们在运营公众号时经常会做一些局部的,如春风拂面般的轻量级优化,那么面对轻量级优化我们又是否有更轻量级的数据分析策略呢?
下面,李少加再分享一个简单的玩法:
如何设计一些方法,局部优化公众号某一核心环节的转化率。
四、公众号局部优化的效果验证
看过《进化式运营》的朋友应该对“用户视角”思考运营问题的方法论感触很深。
我们想下,对于公众号的新粉丝而言,当他初次关注公众号时,通常会推送一批新关注引导语,比如公众号“混子曰”刚关注时会收到自动推送的图片:
大家是否想过,这其实是一个绝佳的“推荐机会”?
抱着这个念头,李少加设计了两套新关注引导语。因此,需要测试哪套引导语能够更好的提升新用户对公众号的印象,进而增加对历史内容的浏览量,并最终提升内容的流动率。
这意味着,让历史推文、那些优质内容能够再次焕发青春,这无疑能够增加流量,增加被转发、曝光的几率,同时也能被动的提升公众号价值公式中:用户活跃率、公众号对其影响力,这两个核心价值指标。
一次极小成本的投入即可获得一劳永逸的运营效益的提升,何乐而不为 ?
那么,我们应当如何衡量引导语好坏呢?
李少加常用的策略,通过“菜单点击率”的变化判断。
很多运营人都不咋用这个数据,着实可惜
优秀的“关注引导语”必然能够提升粉丝对公众号的“探索”热情,而探索必然是通过菜单的点击来完成。
故此,我们同样可以摘取两个不同的引导语,在某一时间周期内,每天新增粉丝的数目、每天菜单的点击人数,然后计算每天菜单点击人数与新增粉丝的比值,最后算下平均值(为了削弱特殊情况的噪音影响)
示例如下:
我们不难计算出,B版本引导语的菜单点击平均比率比A版本提升了:
(0.69-0.49)/ 0.49 = 40.8%
孰优孰劣一目了然。
全文总结
我们经常会看到“数据驱动增长”的说法,但切勿望文生义的奢望数据本身能够驱动用户增长。
驱动用户增长永远取决于:你的运营策略是否更好、更有创造性、更具吸引力。
而“数据”只是为我们的各种新的运营策略是否“变好”提供了及其重要的客观参考,是我们判断真相的「眼睛」。
这才是“数据驱动增长”的内涵:用数据科学的指导、优化工作
当然,对于「少点加班」的各位热衷思考的读者朋友们,必然明白本文的思路远不止于应用在公众号数据分析的范畴。
无论你是做产品运营、做市场分析、客户分析、做内部人力资源管理、行政管理甚至是炒炒股分析行业下的变化,或者分析你的阿猫阿狗是否喜欢新的玩具……都可以灵活应用本文的思路:
明确需要“试验的新方法”
思考强关联的数据参数
设计评估方法
获取数据,套入模型
对比新方法是否「更优」
最终作出科学的判断:是固化新方法呢,还是继续探索更好的策略。
通过本文也可以侧面看出,对于广大运营人而言,“思考力、想象能力、建模能力”远比许多人认为的重要得多。
如果一个运营人只渴望寻找可以模仿、借鉴、拿来即用的套路,那么他被运营界淘汰出局只是时间问题。
作者:李少加 公众号:少加点班
每周一篇,超乎你预期的价值思考,精英不加班,看少加点班
《进化式运营》豆瓣8.6分,购买点菜单:遗世之作-优惠购书
授权转载可在本公众号回复“授权转载”查看转载要求