马蜂窝被捅开的真相,其实你早就知道

在世界杯一轮轮魔性的广告词洗脑之后,很多人条件发射式地记住了马蜂窝旅游这个名字,而现在,因为朋友圈一篇名为《估值175亿的马蜂窝,是一座僵尸和水军构成的鬼城?》的文章,让这个名字又“嗡”的一声在网络上炸开。在这篇文章中描述到,“作为一家主打用户生产内容的旅游网站,马蜂窝的2100万条‘真实点评’接近于核心资产”,但“里面有1800万条是他们通过机器人,从点评和携程等竞争对手那里抄袭过来的”。

  • 两篇文章,把马蜂窝捅了?

上面提到的文章作者梓泉,相关数据来自乎睿数据。一开始,作者是发现一些活跃在马蜂窝问答板块的答主忽男忽女、短时还会瞬移,并以此怀疑马蜂窝内大概率存在水军和虚假的评论。随后作者开始了自己的调查,抓取了马蜂窝上116万家餐厅,并抽取了三分之一的样本,并规定,“一字不差的抄袭,才算抄袭,十句话有一句不同,就不算抄袭”的标准,同时,以抄袭150个不同的大众点评账户为‘抄袭账号’标准”。

在此条件下,作者声称,通过乎睿数据提供的核心数据,“发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评、占到他们官网声称总点评数的85%”。此数据和结论一出,引得网络一片哗然。

昨日,原文作者更是发出一篇《马蜂窝开始毁灭证据了,但这水平真的哈哈哈哈哈哈哈哈》进一步补充道,不仅是【点评】板块,包括马蜂窝的核心【游记】不仅充斥着大量的机器人注水,而且还存在“洗稿/篡改型软文”,其中典型就是三亚一家名叫“小胡子海鲜”。

(现在小胡子海鲜的游记显示为0)

有意思的是,在今早马蜂窝的回应中,并未反驳平台内存在“抄袭账号”,而是解释称,“马蜂窝的UGC内容数据中,游记和攻略占比78.91%嗡嗡(旅行故事)占比7.92%,问答占比10.26%”,“点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的账号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分账号进行清理。自媒体文章所述的马蜂窝用户数量,与事实和第三方机构数据都严重不符”。

不过在最后,马蜂窝还是强调,“一直以来,马蜂窝眼里打击游记和问答中违规广告的行为,平均每周处理26000条违规广告信息,查封15000个违规账号。自媒体将不法商家的违规行为归结于马蜂窝,与事实严重不符”。

  • 点评造假,早已是业内公开秘密

点评造假,水军刷屏,在业内早已不是什么秘密,而且毛病并非国内互联网一家,而是全世界互联网圈的通病。号称收录了逾5亿条全球旅行者的点评及建议的Tripadvisor,中文名猫途鹰上,就曾因此闹出过大新闻。去年,曾经身为水军一份子的英国小哥“Oobah Butler”(化名)突发奇想开了一家根本不存在的“餐厅”,并将其上线至猫途鹰。当然,Oobah提交的菜单是假的,照片是假的,官网是假的,所谓店面地址干脆是小哥自家后院——至于食客们的评论,当然也是假的。

(其实是用清洁球做成的“美味佳肴”)

在Oobah刚注册完餐厅上线后,他的餐厅在伦敦排名18149,基本算是垫底的。但小哥为了提升排名,动用了不少做水军时的资源,为自己的餐厅刷好评。于是这家根本不存在的餐厅在点评网站中的排名不断上升,甚至吸引了不少伦敦市民打电话前来订餐,而每位想要订餐的客户每次都只能得到“餐厅已经订满”的回复。

终于在2017年11月,Oobah的餐厅成为伦敦排名第一的“网红餐厅”,但是截至那时为止,这家“餐厅”从来没有招待过哪怕一个客人。当Oobah最后将这场筹划了大半年的恶作剧公之于众的时候,整个点评网站界都为之轰动,作为“受害者”的猫途鹰网站当即表示,城里人太会玩了,这种操作我们乡下孩子根本没见识过,“我们没办法检测到这样一家根本不存在的餐厅,鉴别上面评论的真假……”

至于围观的吃瓜群众们,非但没有觉得Oobah的玩笑过火,甚至引发了一波反思潮——对盲目信服网红产品的反思,对商家雇佣水军吹捧的反思,以及对平台内容把控审核的反思。

  • 对付爬虫,还需打中三寸

我们再回国头来看看马蜂窝事件,和上面提到的例子有所不同的是,除了可能存在的捏造评论,文章作者更多地是在控诉平台上“1800万条点评,全是从竞品那里抄的”这一现象。甚至于根据文章引用的每周/每日餐饮点评趋势统计数据来看,这些涉嫌“引用”的评论甚至可能是员工在工作时间一条一条,“人工撞库”,“人工爬虫”出来的。

撞库、爬虫,这些技术在当下互联网人耳中以不陌生。但为什么说是“人工”的呢?根据乎睿数据的统计发现,在每周餐厅点评趋势图表中,大众点评的用户每到周末会变得活跃,但“马蜂窝的大部分用户集中在周中写点评,一到周末,断崖式下跌”。而具体到每日餐饮点评趋势,大众点评一般是午饭和玩法时间较为活跃,但是“马蜂窝相反,午饭和晚饭时点评少,工作时间(10点-12点)、(2点-5点)更活跃”。

再回到爬虫和撞库的问题上来,不管是不是人工操作的,首先我们要强调一点,技术本无罪,有错的是往往是使用技术的人,事实上,运用爬虫数据,你可以只是合成一张美少女的壁纸,也可以用它来分析比对内部数据,甚至,你可以用它来盗取人们银行卡的账户密码。但是这些年,这些技术在打【版权】的擦边球时尤为频繁,比如短视频内容的爬虫、内容平台里的连环车祸,以及这次马蜂窝与大众点评携程在内容上出现的问题。

若说网友们对行业里的水军、撞库等情况完全不了解,恐怕不见得。大多数网友看到马蜂窝的这两篇文章时,都调侃式地表达出“天下文章一大抄”的观点。但说到撞库、爬虫,最直接侵害的其实就是用户的权益,但是用户们维权的意识往往薄弱。指望平台之间维权?潜规则之下收益的可能今天是你,明天是我,所以最后往往罚酒三杯了事,等于是变相放纵了平台和商家们进一步有恃无恐地扩展自己虚假的繁荣。

普通用户没有管的意识,平台之间睁一只眼闭一只眼,那么如何应对这种“天下文章一大抄”的现象呢?其实我们细度前面提到的两篇文章中援引乎睿数据指出,“在冷启动以及融资时期(抄袭账号)尤为活跃”,暗示马蜂窝或是为了抬高自己的估值而刷数据,这就实打实戳中平台的痛处了。所以这篇文章与其说是写给广大马蜂窝用户以示警醒,倒不如说是给马蜂窝的投资者,或者未来的“接盘侠们”看的。

【本文图片来自网络】

推荐阅读:

100%全面屏要来了,但或许只有一家厂商能做到

解决了前置摄像头,也就意味着真·全面屏不再是问题。

刷爆朋友圈的互联网穿搭指南,是正经图鉴吗?

平常你在公司穿的是啥?

(0)

相关推荐