王菊、纸尿裤、杜蕾斯,高大上的“AI智能推荐”为何总感觉有点low?
工智能、云计算、大数据等前沿技术概念日益火爆,各家互联网公司也纷纷宣布自己在用AI(人工智能)做智能推荐、大数据分析,让自己更懂消费者,让消费者更容易看到自己想看的内容。可这样的吐槽想必你也经常听到,“为什么我买了沙发,它还不停地推荐沙发给我”“为什么我偶尔浏览了一下八卦新闻,现在首页展现给我的都是娱乐圈里的事”“这到底是智能?还是智障?”
一边是大数据浪潮、人工智能革命似乎已经来临,另一面受众确实有“不被理解的苦”,无论是谁,无论是否真的需要,任意点击浏览就可能带来强势的关联推送,问题究竟在哪?
过于“灵敏”的信息推送
被繁杂的信息流轰炸几乎是每一位手机用户当下共同的经历,那些向你涌来的海量信息看似与你相关,却并不真正了解你的需要,就像个卖力的销售员卖力介绍,却总是不得其法。
百度移动App就像是一名不太合格的“新闻推销员”。用户刘小姐前不久因为追看一档真人秀节目,在百度上搜索了其中两位主角的信息,但让她没有想到的是,简单一次的检索,让百度错误地给自己打上明星粉丝的“标签”,从此之后每一天,打开百度浏览器,推荐新闻中就有与其中一位明星相关的新闻、八卦、绯闻。
“这些新闻内容粗糙,真假难辨,让人感觉更像是为这个明星提高曝光率的软文广告。”刘小姐回忆,一直到这档真人秀结束,百度新闻还在推这个女明星相关的新闻,让她从最初的感兴趣发展到没兴趣,最终直接选择漠视类似新闻。“作为普通用户我没有办法关闭类似的推送,只能选择漠视,用这种方式告诉浏览器,我真的不需要这样的新闻推送。” 受此影响,刘小姐打开百度浏览器的频率也低了。
无独有偶,张先生前段时间在淘宝网上浏览木质家具,一周后下单完成了购买。但让他没想到的是,紧接着与木质家具相关的各种信息推送铺天盖地地向他袭来,有通过应用自身推送的木质家具专栏文章,也有一些品牌直接给他发送促销短信,整整持续了两周时间。但让张先生感到困惑的是,“家具重复购买概率很低。这样的推送既对商家没有直接帮助,对消费者也是一种骚扰。”事实上,买完家具后,刚搬新家的张先生对家电的需求更高。所谓的大数据分析,为什么只是根据历史搜索记录做重复推送,而无法预判他下一步的购买行为呢?
(电商网站的推荐未必是用户感兴趣的)
记者做了随机采访,发现类似情况非常普遍,比如夏天在淘宝上选购了泳衣,之后仍会不断收到与泳衣相关的推送,但很少收到游泳眼镜或者出游背包等相关联商品的推送。这种推送究竟是否智能?
同样的“强推”还出现在当下风头正劲的短视频网站。用户唐女士前段时间下载了抖音,但她发现抖音上的内容无法手动检索,全部依靠网站推送。作为新增用户,网站怎么推送呢?尽管抖音的母公司今日头条一直强调自己是个技术公司,用算法来推荐内容,但唐女士只是随意浏览时无意点击了一段“鬼畜”视频,结果之后收到的大部分推荐内容几乎都是同类内容的“复制版”,“这样的内容推送既不智能,也不有趣。”最终,唐女士选择删除了抖音。
“用户都是平面的”
对于这样层出不穷的现象,苏宁云商集团副董事长孙为民曾提出过这样一个解释,大数据有一个问题,它所掌握的趋势不是因果关系,而是概率关系——比如,你买了一本经济学的书,接下来还可能买同类的书,可能给自己买,也可能给别人买。”在他看来,这样的推荐本来就缺乏个性化追踪。
“在大部分互联网平台的后端,所有用户的‘画像’依然是平面的。” 一位从事数据营销的业内人士告诉记者,在传统广告营销业内,类似广告信息流的推荐都是基于用户标签,比如性别、年龄、浏览历史、历史购物记录、收藏记录等等,这些用户按照不同标签被排列组合成不同人群。但到目前为止,大量在互联网平台投放的广告主依然是以“历史成交”人群作为核心推送人群,“购买了A泳衣的人,同样可能购买泳衣B,这种情况比较普遍,对大多数用户来说,这个策略是有效的。”
尽管大数据库内给用户制定的标签高达数十项甚至上百项,包括年龄、性别、居住城市、浏览足迹、购买习惯等等,但“历史成交”“历史浏览”依然被认为是最强关联且最有价值的判断依据,“大量广告主依然相信有历史成交的人群,会有更高购买概率,因此会向有历史浏览记录和成交记录的人群进行大范围的粗放式推介。”但历史成交人群中究竟有多高比例的转换?这位人士很难拿出具体的数据,同时承认类似的大范围广告推介,投入成本更高,但精准度会下降。
即便是新兴发展的短视频网站,依然在如何更智能地利用用户画像上难有突破,“抖音的算法推荐就是根据现有内容添加标签,进而在赛博空间(计算机算法构筑的数据统计)上完成用户特征描绘,直接进行推送。”在业内人士看来,在抖音后台,每个用户都是由一堆标签构成的账户,推荐的精准度取决于用户的点赞、观看时长、对播主的关注以及广域统计下的“大众流行推荐”。因此,用户的个人画像依然是扁平化的,由此导致抖音推荐的内容“同质化”严重,缺乏真正的个性。
真正智能推荐或在未来2年内实现
“真正意义上的大数据不应该是一个数据搜集归类库,而应该是‘智能数据整合装置’。”一位大数据研究机构的人士认为,除了那些商家花钱的硬推广告之外,目前的大数据依然无法真正做到智能化,“比如某阶段用户需要的商品,因为这个阶段的频繁搜索被半智能的大数据定义为喜欢,从而进行相关信息推送,但有些商品本身并不存在复购率。
真正的大数据应该做到更全面,比如用户购买的水果是复购率极高的商品,通过大数据可以做到两周后再次推送,或者如果用户买了红酒,可以自动推送冰桶或者相关联的商品。”在这位技术人士看来,真正的大数据推送不应该是简单粗暴的推送,而是根据用户意愿进行有效推送,而要做到这一点,至少还需要2年,“随着物联网时代来临,这样的情况会有所好转。”
孙为民也曾提到类似观点,在他看来,到了物联网时代,互联网公司所累积的数据以及数字化产生的关系很大程度产生因果关系,把人、场和景定位了,就可以根据个性化追踪来得出结论,“比如你之前买的鞋,放了很久没有穿,鞋自身的感应数据被传输到后台,你再去同一家店铺购物时,智能收银系统就能对你的购物偏好做出智能提示,避免用户再购买相同款鞋。”前者是推荐用户买买买,后者可能是引导用户更智能地买。