1. 研究目的与意义
随着电商的出现和各类社群APP的不断发展,人们对商品的了解方式更加多样,购买渠道更加丰富,选择空间更加充裕,人们的消费模式发生了改变。但与此同时,由于平台的店铺模糊类搜索排名机制,卖家以礼品、好评返现等形式诱导客户好评,甚至直接雇佣人员刷单,来获取大量好评,企图在平台搜索结果中取得较为靠前的排名,或采取故意给竞争对手刷差评,使其排名下降等不正当竞争手段,扰乱市场秩序,干扰消费者选择。部分恶意买家也会以差评威胁卖家,要求给予一定的优惠,或故意“好评低分”,评论与评分不一致等等。除此之外,热门商品的评论数大量积累也使得用户很难筛选出对自己有帮助、或自己感兴趣的评论。
因此,如何准确识别正常客户的评论,隐藏无效评论并降低或减去其在平台评分机制中的影响,合并相似评论,再将结果展示给顾客是各大电商平台亟待解决的问题。2. 研究内容和预期目标
研究内容:
现有的研究多单纯地将虚假评论或无意义的评论从评论数据中剔除,忽略了买家在参考商品评论时,不仅要看真实的评论,更要看自己关心的方面的评论。因此,商品评论有效性则是虚假评论研究的下一步方向。本文将评论分为以下几类:
1.虚假评论类。指卖家刷好评的评论,或被竞争对手、无良买家恶意差评。
3. 国内外研究现状
1.国外文献研究
产品虚假评论的概念,最早是由jindal[3]在2008年提出的。jindal等人研究后发现,虽然虚假评论广泛存在于商品中,但其本质与垃圾网页和垃圾邮件不同,于是将产品虚假评论分为虚假评论、无关评论和带有品牌偏见的评论。他们抓取了亚马逊的商品评论信息,并进行人工标注,从评论内容、评论者和被评论的商品三方面提取特征值,使用逻辑回归构建机器学习模型来区分复制观点和非复制观点,检测出是复制观点时则判为虚假评论。jindal 等人的研究对非评论和无关评论的识别效果理想,但是其只将重复评论作为机器学习的训练集,对于其他特点的虚假评论的识别有较大局限性。
xie s[4]等人在2012年提出,单一评论是虚假评论的重要组成部分。正常的评论比较稳定、相关性低。相比之下,虚假的评论相关性高且具有突发性的特点,表达情感极性强。因此提出时间模式,采用基于多维聚合的时间序列统计构建模型,以此挖掘虚假评论的相关性。
4. 计划与进度安排
1.文献综述,分析国内外的研究现状和方法;
2.确定研究方法,比较现有的研究方法和实现可能性,确定研究方向和实现方法;
3.数据搜集,通过爬虫或查找已有数据库来获取数据;
5. 参考文献
[1]人民网。刷量、虚假评价不仅是行业乱象更对网络公平环境造成严重损害。http://hlj.people.com.cn/n2/2019/0731/c387763-33199376.html,2019
[2]新浪科技。调查:虚假评论充斥亚马逊,杂牌产品占领搜索首页。https://tech.sina.com.cn/i/2019-04-16/doc-ihvhiewr6422456.shtml ,2019
[3] jindaln , liu b . review spam detection[a]. proceedings of the 16th international conference on world wide web[c].acm,2007:11891190.
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。