2018年10月21日,马蜂窝旅游网对全站游记、攻略、嗡嗡(旅行故事)问答、点评等数据进行了核查,并对涉嫌虚假的信息展开查处。
马蜂窝在公开声明中表示,餐饮点评不是马蜂窝的内容核心,且部分点评来自于游记、问答的内容的提取,自媒体将马蜂窝用户内容生产的活跃周期,与餐饮等本地生活服务类APP相对比,并解读为马蜂窝员工有组织地抄袭,存在明显的误导倾向。
实际上,就此事业内也有不同的观点。
“马蜂窝承认部分点评来自内容提取,让UGC行业或多或少地暴露出原创内容端的不足、不同端口资源共用等问题。”业内人士分析认为,马蜂窝被疑抄袭的内容存在一定的被“反爬”迹象,比如点评中出现翻译提供方的字样等恰恰说明这是行业比较常见的操作。
电子商务研究中心生活服务电商分析师陈礼腾认为,有些平台从其他平台抓数据的目的是为了制造流量很大的假象,既给用户看、商家看,更是给投资人看。由于不涉及到数据库门槛,在技术上没有难度,任何一个爬虫工程师就可以做到,也可以批量处理,通常是“机器抓取+人工编辑”。
“互联网公司利用爬虫技术,从其他平台抓取数据的行为应该说较为常见。”陈礼腾表示。
此外,从事旅游平台管理的技术员小王告诉记者,讨论行业共性问题时首先要清楚这次报告显示的数据抓取和分析是否存在系统性偏差或者内定指标。他建议,可以同样抓取相关平台数据做行业对比分析才有说服力,除此之外应把平台系统性造假和用户自身一稿多投的问题区分开。“前者是蓄意欺骗,后者算是监管不严。”
爬虫抓取、抄袭和造假在互联网行业并不少见,陈礼腾表示,甚至已经成为很多平台屡试不爽的一大“捷径”,但对于像马蜂窝这样的企业而言,或许入驻马蜂窝平台的商家为吸引人气和流量所为的可能性更大。
马蜂窝回应造假 一家名为“乎睿数据”的团队,通过数据抓取和分析,发现马蜂窝上有七千多个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评。