当前位置:新闻 > 中国新闻 > 正文

“我们只是点评的搬运工”? 马蜂窝或捅出旅游网站“潜规则”(2)

2018-10-25 18:06:01    新华网  参与评论()人

而据相关媒体报道,旅游网站携程与“去哪儿”同样发生过“点评数据之争”。2008年,因“去哪儿”网站中有数万个页面转载有携程酒店点评文章,携程将“去哪儿”告上法庭。最终经法院审理确认,携程拥有该网站内容及资源的版权,“去哪儿”行为属于侵权。

记者调查:多个旅游网站均存在“点评搬运”现象

按照乎睿数据的说法,马蜂窝若抄袭了1800万条点评,如此量级的数据远非人力所能完成,有业内人士表示,该行为或是利用爬虫软件完成。

所谓爬虫软件,是指按照一定规则,自动抓取互联网信息的程序或者脚本。该人士表示,利用爬虫软件,抓取其他网站数据,再搬运到自身平台,这在互联网行业并非新鲜事。

事实果真如此?爬虫软件抓取数据难度有多大?记者随机选取了北京一家酒店,利用爬虫软件,不到两分钟便抓取了其在携程和同程旅游网站中的百余条点评内容。通过比对两份数据,记者发现,该酒店在两个网站中存在13条完全雷同的点评,而且多数点评在两个网站所显示的日期完全相同。

其他平台是否也存在此类现象?记者进一步检索该酒店在其他平台的点评数据,发现驴妈妈、马蜂窝等旅游网站中,点评雷同的现象同样存在。其中一条103字的点评内容在同一天内分别出现在了携程、同程旅游和驴妈妈网站上——这意味着有消费者在一天内通过三个平台订了同一家酒店,并发表完全相同的点评,显然并不合理。记者发现,该酒店在驴妈妈上一共有5条点评,均能在其他平台的点评中找到完全相同的“孪生兄弟”。

“点评搬运”是网站行为还是个别酒店的行为?对此,记者又随机抓取了上海两家排名较靠前的酒店在不同平台的点评数据,发现或多或少均存在雷同的点评,这些点评中,既有相对简单的好评,也有长篇控诉和差评,部分点评账户连名称都是“搬运”而来。值得一提的是,记者在比对数据中将“一字不差”作为判定雷同的标准,许多在搬运后由人工进行“洗稿”的点评并未反映在内。

关键词:

相关报道:

    关闭
     

    相关新闻