当前位置:新闻 > 社会新闻 > 社会新闻更多页面 > 正文

蚂蜂窝起诉乎睿名誉侵权 马蜂窝“被捅”数据造假(3)

2018-10-23 10:28:34  网易科技    参与评论()人

马蜂窝否认85%点评造假

上述报告显示,乎睿数据团队经过数据分析发现,马蜂窝上有7454个抄袭账号,合计从竞品网站上抄袭搬运了572万条餐饮点评与1221万条酒店点评,占到官网声称总点评数的85%。

乎睿数据团队剔除“抄袭账号”后,在余下的所有账号中选择了15000个最活跃的账号,发现用户在答题、点评等行为时间上高度一致,且与其他同类型评论网站发布时间差异较大,大多是工作时间(周一至周五10时至12时、14时至17时)更为活跃。

乎睿数据团队还发现,一批在游记攻略中植入广告的商家通过抄袭、拼接等“做号”、“洗稿”手段批量炮制出含有广告内容的游记、问答、回复,再由大量的小号、马甲进行人工置顶,达到以低成本对平台上亿用户打广告的目的。

乎睿数据团队“捅了”马蜂窝,一时间舆论如潮。马蜂窝于22日上午7点45分在微博发布声明称,马蜂窝的UGC内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%。这些数据背后是用户真实的情感与回忆,也是马蜂窝内容的真正价值。

马蜂窝进一步表示,点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的账号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分账号进行清理,其认为“自媒体文章所述的马蜂窝用户数量与事实和第三方机构数据都严重不符”。与此同时,一直以来,马蜂窝严厉打击游记和问答中违规广告的行为,平均每周处理26000条违规广告信息、查封15000个违规账号。

对于报告数据挖掘选用的工具与分析的科学性与准确性等问题,记者22日通过邮件向乎睿数据团队提问,但截至发稿尚未收到回复。

数据爬虫业内屡见不鲜?

关键词:

相关报道:

    关闭
     

    相关新闻