数据猿专访 | 比邻弘科联合创始人史建刚：数据造假忍无可忍，我们要像金庸一样创造一个“不妥协的世界”

2024-06-13 07:52:54

<数据猿导读>

近年来，移动互联网浪潮席卷着中国市场。而在这次革命浪潮中，众多资本涌入，造成移动流量推广行业迅猛发展的同时，也滋生了很多产业泡沫，其中最大的泡沫就是流量造假。比邻弘科告诉数据猿记者，大量数据造假，让大数据的精准无处可放

来源：数据猿记者：张叶

近年来，移动互联网浪潮席卷着中国市场。而在这次革命浪潮中，众多资本涌入，造成移动流量推广行业迅猛发展的同时，也滋生了很多产业泡沫，其中最大的泡沫就是流量造假。

流量造假的恶果之一是获客成本居高不下。表面上看似2元买来的假量用户，最终核算到真用户头上，价格已经超过100元。

假量造成的恶果之二是“假量”输出。一方面，假量输出给互联网公司，掩盖产品问题，让企业被假量绑架，失去创新动力；另一方面，假用户、假数据一层层被输出给VC，再到资本一级市场、二级市场，所有参与其中的人从上到下精心维护着一个“皇帝新衣”。

如果不及时遏制假量输出，最终危害的是市场秩序，引发的是产业动荡和社会不安。

这段话是数据猿记者在见到史建刚之前，从他的知乎（账号：以史为贱）上看到的文字，字里行间不难看出他对数据造假的深刻认识以及深恶痛绝。

“比邻弘科一直致力于大数据精准营销，为企业提供精准的用户画像。但是有一次，我们遇到一个客户，他们的数据实在让人难以容忍。一般而言，企业数据掺假量为2-20%，也算是行业默认的‘可容忍度’，但是他们给出的数据——真实数据量占比20%——实在是突破了我们的心理底线。通过这样的数据做任何数据分析和数据挖掘都是没有意义的。”史建刚告诉数据猿记者。

大量数据造假，让大数据的精准无处可放。比邻弘科一下子被推到极为尴尬的境地，要么跟着做假，要么隐忍行业恶习，显然都不切实际。经过长时间思考，他们最终决定走一条不一样的路——跟数据造假者对着干。“只要是问题，就存在商机，那么比邻弘科在市场上就有机会。这就是我们研发流量反作弊产品的初衷。”

众所周知，金庸先生为成人世界描写了一个“江湖童话”，虽然跟真实世界格格不入，却别有一番逻辑。史建刚称，比邻弘科也想效仿金庸老先生，走一条与别人不同的路，造就一个绝不妥协的江湖世界，所以将产品取名为“量江湖”，是一个极具“江湖气息”的流量反作弊产品。

反作弊，我们是专业的

虽然数据造假有各种手段和方式，但行业里针对流量造假的反作弊手段无非三种，史建刚为记者介绍到：

第一种，以人肉为中心的反作弊防护体系。比如通过第三方统计数据，依靠人工检查IP重或不重，转化有没有问题，这种做法即费时又费力。但是目前很多公司依然停留在这一阶段，配置十分落后，落后就要挨打。如果整个生态环境都是这种水准，还谈什么行业发展？

第二种，以KPI为中心的反作弊防护体系，是利用专业系统评估每个渠道和每个用户质量。这种方式2-4人团队配合，成本大概一年40-80万不等，主要利用IP地址、留存、启动次数、在线时长等关键参数。

第三种，以UBP（用户行为模式）为中心的反作弊防护体系，这也是比邻弘科主推的反作弊手段，需要接入大量数据源，如IP库、智能设备库、用户行为数据等。

比邻弘科将SDK嵌入到客户系统之后，能够读取设备信息并对数据进行分类鉴别。从造假数据的特征来看，如果是假用户，刷量过程中只会在APP模拟指标、模拟留存上下功夫，没有其他动作。而一台正常手机，95%以上都安装微信，80%用户会刷微博、用百度、上淘宝，可是虚假用户的这些行为数据是没有的。

另外，真人拿着手机在吃饭时，会时常链接到运营商网络进行基站切换，而造假的手机ID是不发生变化的，就像一个安静的美男子被固定安排在一间房间内偷偷刷流量“吐”数据。

除了人肉刷量、机器刷量外，市场上当然还有很多其他造假手段。史建刚坦言，比邻弘科目前并不能全覆盖数据造假手段。而且，“道高一尺，魔高一丈”，就行业现状而言，帮人刷量的团队水平普遍高于普通公司的“防假”能力，造成许多企业对于数据造假防不胜防。如此一来，只有将问题交给专业负责反流量作弊的公司来做才是正确选择。

比邻弘科服务过很多客户，一旦行业内刷量技术有了新变化，他们就有能力快速识别并作出技术反应。“我们拥有自己的异常行为特征库，积累了1000余种异常行为数据，这也是比邻独特的优势之一。”

打击造假，还要靠强劲的技术手段

作弊识别是极其复杂的一项工程，有的作弊特征非常明显，有的则隐藏很深，还有少量数据特征不够明显，甚至是概率事件。史建刚称，在识别作弊行为上其实可以采用多层防护、多维判定、独立识别、综合评定的全套作弊识别解决方案。

首先，数据过滤过程中使用三层分滤技术：第一层快速过滤常见指数和参数，如果有明显问题很快就能被挑出来；第二层分析群体行为，进一步筛选异常数据；最后，利用异常行为特征库和用户行为数据分析，但这需要很高的计算成本。

“正是因为使用了三层过滤技术，我们才能够在10分钟内快速识别数据真假。因为在第一层和第二层过滤时，绝大部分用户已经判定完全，问题基本被解决，用时大概10分钟。但是会剩下少数‘疑难案例’需要调用更多数据识别，进行深入的第三层筛选。”

任何科研技术的研究都不是一蹴而就。比邻弘科的产品研发也是从耗时几小时逐渐被缩短至十分钟。“我们希望能够给客户提供一个10分钟之内的解决方案，这也是最初确定的目标。因为10分钟对客户来说是有意义的：如果超过1小时，客户体验会很差，但如果设定1秒钟也不实际。10分钟，是比邻弘科经过3个月的算法研究，验证多次后得出的最佳筛选效果的最短时间。”

其次，用指纹DNA技术标定设备。由于每台设备ID都是唯一标识，通过采集真实设备上的其他信息，如IP地址、CPU信息、操作系统版本等各种数据组合在一起，编写“设备指纹DNA”程序，用来确定设备ID的真实性。指纹DNA概念是这两年新兴技术，属于独特信息的合理取值，之所以用“指纹”定义，也是因为它具有独一无二性，不可被伪造。

不过，行业不同，数据特征多多少少会有所差别，筛选结果也会有所遗漏。目前，比邻弘科的假量筛选准确率达85%以上。在这些假数据里：一部分是可以完全确定的假量；一部分是可疑性数据。

另外，史建刚坦言，目前他们的数据模型，在辨别真假时也存在“证据不足”的现状，但这些可疑信息依然会提供给客户，然后由客户结合自己的数据作出判断，因为比邻弘科在为客户提供服务时不会采集客户的业务信息。

微信小程序出现，反作弊行业将会受到冲击！

在采访中，当记者问到比邻弘科接下来的计划时，史建刚并没有直接回答这一问题，而是先表达了他对9月21日，张小龙宣布微信小程序上线一事的看法。在史建刚看来，在这样的背景下，反作弊的“量江湖”好像有了不一样的意义。

其实，在同一天还有一条消息被大家忽视了，那就是百度放弃了曾经19亿美金收购的91助手。史建刚告诉数据猿记者，两件事情放在一起，可以说宣告着整个移动互联网时代正式进入下半场。

他向记者解释说，在移动互联网时代的上半场，投资人、运营者都在拼产品、拼模式以及拼融资能力。但是随着人口红利下降，获客成本提高，运营成本必然增加。所以，下半场，将是企业间拼运营的时代，这就为流量反作弊产品提供了生存机会。

首先，在运营阶段，企业要把推广成本降下来就需要通过反作弊体系筛选出真假用户，并对渠道进行评价，以便帮助企业调整定价。

其次，企业竞争的本质其实是用户时间。很多公司通过不同维度把用户分类，比如消费贡献、内容贡献、在线时长贡献等；也会把用户分成好几种，如金字塔尖用户、正常用户、边缘用户，但是这种金字塔用户结构是不合理的。要把各层面用户均匀化，彻底了解用户，对用户进行画像。这是“量江湖”将要做的事。

但是，随着“微信小程序”时代的到来，“量江湖”受到了冲击。史建刚无奈地说：“有了小程序，APP数据封闭在系统内出不来，即使想要判断真假，我们也有心无力。所以，比邻弘科必须加快脚步向前走，从原来反作弊体系向运营体系过度。”不过，史建刚还是很乐观的对记者说，“虽然新模式出现了，但谁对它都没有办法，大家都在一起等待。”

本文记者张叶（微信：1104644189）

来源：数据猿

巨头加持，详解国内首个广告反作弊大数据实验室！

随着越来越多的广告预算流向数字渠道,广告作弊也成为一门水涨船高的大生意. 2016年,AdMaster旗下第三方广告监测产品 TrackMaster的反作弊模块 BlueAir侦查到国内的无效营销流量 ...
Adjust Eric Wang：监测广告流量防作弊为海外广告主保驾护航 | 游戏干线

图/广告流量监测前言在12月17日举办的GTC2020全球流量大会上,来自移动数据监测平台Adjust的销售负责人Eric Wang在大会上分享了题为<预判2021- 游戏出海新热点.新机遇 ...
推广干货：如何防止流量作弊？

诸葛君说:"所有的营销都是有效的,所做的投放都是精准的",可以说这是市场人共同的梦想.可事实往往并不如愿,从近100年的广告史来看,不论是依靠经验判断.强媒介投放资源的传统广告,还 ...
硬核：投放效果大幅提升的秘密

投放效果差,是企业在数字化营销中经常面临的问题,今天,我会重点和大家聊一聊如何通过移动端的数字化广告的投放,获得高流量转化. 在移动端的智能手机上,广告展示.点击购买.移动支付已经形成了完整的购买链条 ...
爱奇艺关闭剧集前台播放量显示：影视业告别“唯流量论”

9月3日,爱奇艺发布声明,宣布正式关闭全站前台播放量显示,今后将逐步以内容热度代替原有播放量.内容热度包含用户观看行为数据.互动行为数据.分享行为等综合数据维度.后续还将增加热度排行榜.内容既往热度曲 ...
干货 | 如何把钱花在刀刃上

如何评估一个平台的投放价值?用户匹配不准,转化效果不好,花了钱打水漂儿怎么办?如何把广告效果最大化是很多营销人/运营人梦寐以求的,特别是在现在这个线上线下流量获取费用都暴涨的年代.围绕广告投放及获客质 ...
用户行为是怎么影响网站SEO排名机制的呢？

在前面的文章平哥SEO优化讨论过,SEO的根本原理在于提高网站内容相关性.权威性和实用性.其中的实用性指的就是用户行为,也就是说网站实用性越高,对用户越有用,用户表现出来的行为又会影响网站排名. 1. ...
渠道数据异常怎么分析？3个原则+3个步骤告诉你

推广投放分析这块的思路是相对固定的,主要用户质量和获客的性价比为主,当分析出问题后,找到原因就需要对推广投放的场景和各种影响因素有比较多的了解. 而分析的难点就在于推广投放这个场景的水是很深很复杂的, ...
数据猿专访 | 晶赞科技联合创始人梁信屏：企业想要获得最大价值，必须对数据背后的“受众”做最精准管理

数据猿导读晶赞科技联合创始人梁信屏,2005年,曾在谷歌负责DoubleClick广告平台:2012年,担任力美科技CTO,搭建了国内最早的移动DSP平台:此前,还在百度负责百度"凤巢&q ...
数据猿专访 | 数介科技联合创始人孔祥鹏：数据只储存没用，最终是要解决用户问题

<数据猿导读> 很多大数据公司都知道用户们需要大数据,但却不知道该怎么为用户服务.数介科技的孔祥鹏在接受数据猿记者采访时提到,用户本身有数据,但过于依赖传统应用软件,没办法独立分析,所以谁 ...
数据猿专访 | 易日升金融公司总裁史建伟：“天网”才是打造大数据风控的正确姿势

<数据猿导读> 易日升金融总裁史建伟接受数据猿采访时表示,传统金融对用户信用审批的"5度评级",已经不能适应互联网消费金融的业务模式.而易日升金融通过基于家庭的场景大数 ...
数据猿专访 | 力美科技CTO陈昱：大数据与DSP的融合之道

<数据猿导读> DSP究竟靠不靠谱?DSP的未来究竟在哪?数据猿为此专访了力美科技CTO陈昱,让我们看看他是怎么说的. 来源:数据猿记者:大文今年4月,艾瑞发布数据称,2015年网络广 ...
数据猿专访 | 瑞恩传媒CEO米磊：基于大数据的程序化购买，才是数字营销的未来

<数据猿导读> 现如今,数字营销传播越来越受到广告主的重视,但是在广告投放过程中,大部分企业仍旧不知道如何挖掘数据的潜在价值,使人群数据变现.瑞恩传媒创始人米磊告诉记者:"瑞恩在 ...
数据猿专访 | 艾媒咨询CEO张毅：大数据让营销变得更靠谱了！

<数据猿导读> 对于咨询公司来说,大多是提供咨询服务,以卖报告为盈利模式.而到了大数据时代,走在时代前沿的咨询公司又有了新玩法来源:数据猿记者:春夏对于咨询公司来说,大多是提供咨询服 ...
数据猿专访 | BitTiger联合创始人苏铭彻：用硅谷精神做教育

数据猿导读如何在高手如云的硅谷获得先机?华人工程师要如何自我提高?大量以分享技术为主的社群应运而生,但有深度的内容依然匮乏.BitTiger联合创始人苏铭彻和我们分享了如何运营一个高质量技术社群. ...
数据猿专访 | Kyligence联合创始人兼CEO韩卿：解密中国大数据界的“神兽”

<数据猿导读> Apache软件基金会支持孵化的项目300多个,顶级项目162个.而Apache Kylin是其中唯一一个由中国团队贡献的顶级项目.数据猿记者有幸采访到Kyligence公 ...
数据猿专访 | 薪人薪事联合创始人吕恒：玩转大数据，用数据理念解放HR生产力

<数据猿导读> 数据猿记者在探访大数据应用场景发展情况时发现,市场上早已出现用大数据解放HR劳动力的行业"产物".薪人薪事联合创始人吕恒告诉数据猿记者,"HR ...

数据猿专访 | 比邻弘科联合创始人史建刚：数据造假忍无可忍，我们要像金庸一样创造一个“不妥协的世界”

相关推荐