当前位置: 首页 > 专利查询>田刚专利>正文

一种基于评论外部信息的虚假评论检测方法技术

技术编号:20945002 阅读:48 留言:0更新日期:2019-04-24 02:36
本发明专利技术提供了一种基于评论外部信息的虚假评论检测方法,该方法通过对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,将评论及其标签数据组按照4:1的比例分割成训练组与测试组,然后对训练组与测试组进行文本预处理,建立虚假评论检测模型,利用卷积神经网络来提取外部属性向量,利用加入注意力机制的长短期记忆网络提取评论内容向量,并在特征提取之后将在线性组合层中将提取的特征进行线性组合。本方法可以实现所有国际电商英文评论的虚假检测,具有较好的通用性,本检测方法的精度达到了81.4%,能够胜任大部分的检测任务。

A Method for Detecting False Comments Based on External Information of Comments

The invention provides a method for detecting false reviews based on external information of reviews. The method extracts and labels the contents and external attributes of reviews in a review document, forms a data group of reviews and tags, divides the reviews and tags into training group and testing group according to the ratio of 4:1, and then preprocesses the training group and testing group, and establishes a text preprocessing method. In the model of false comment detection, convolutional neural network is used to extract external attribute vectors, and long-term and short-term memory network with attention mechanism is used to extract comment content vectors. After feature extraction, the extracted features are linearly combined in the linear combination layer. This method can be used to detect the falsity of all international e-commerce English reviews. It has good versatility. The accuracy of this method reaches 81.4%, and it can be competent for most of the detection tasks.

【技术实现步骤摘要】
一种基于评论外部信息的虚假评论检测方法
本专利技术涉及服务计算
,具体涉及一种基于评论外部信息的虚假评论检测方法。
技术介绍
随着互联网业务的发展,为了可以让用户根据自己的意图和其他消费者的评价来决定购买意向,各大电子商务平台开发了各种用户反馈机制,其中产品评价系统是最普及一种。由于许多用户在电商平台上倾向于在做出购买决定之前阅读相关的产品评论,所以某些不法者在电商平台利用评价系统注入大量虚假评论来左右产品的销量以达到盈利的目的。根据一些研究人员的统计,虚假评论占Yelp网站的14-20%,在Tripadvisor,Orbitz,Priceline和Expedia中有2-6%的假评论。在这种情况下,要有效识别虚假评论已成为一个中心问题,确保网上评论成为值得信赖的意见材料,提供发展健康有序的产品反馈环境。为了有效识别这类评论,一些学者使用基于浅层、显性语义特征的方法,虽然取得了一定成果,但是检测效果不尽人意。因此,在互联网商品信息、用户评论数量的飞速增长下,提供一个准确的虚假评论检测方法可以解决产品评价系统检测的关键技术问题。
技术实现思路
针对现有的虚假评论检测方法存在的检测准确度本文档来自技高网...

【技术保护点】
1.一种基于评论外部信息的虚假评论检测方法,其特征在于,包括以下步骤:步骤1:收集商品评论文档,对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,评论及其标签数据组包括评论内容集、外部属性集和标签集,将评论及其标签数据组按照4∶1的比例分割成训练组与测试组;步骤2:对训练组与测试组进行文本预处理:使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one‑hot向量;步骤3:将卷积神经网络与加入注意力机制的长短期记忆网络通过向量连接操作建立虚假评论检测模型,使用步骤2中训练组得到的评...

【技术特征摘要】
1.一种基于评论外部信息的虚假评论检测方法,其特征在于,包括以下步骤:步骤1:收集商品评论文档,对评论文档中的评论内容及外部属性进行提取并加标签,形成评论及其标签数据组,评论及其标签数据组包括评论内容集、外部属性集和标签集,将评论及其标签数据组按照4∶1的比例分割成训练组与测试组;步骤2:对训练组与测试组进行文本预处理:使用Word2Vec模型将训练组与测试组中的评论内容集和外部属性集分别训练成评论内容词向量和外部属性词向量,将训练组与测试组中的标签集转化为one-hot向量;步骤3:将卷积神经网络与加入注意力机制的长短期记忆网络通过向量连接操作建立虚假评论检测模型,使用步骤2中训练组得到的评论内容词向量和外部属性词向量训练虚假评论检测模型,不断修改虚假评论检测模型参数使分类效果达到最优;利用虚假评论检测模型对测试组得到的评论内容词向量和外部属性词向量进行分类,验证虚假评论检测模型准确度。2.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,步骤1中对评论内容加标签的过程为:将虚假嫌疑大的评论内容标注为“0”,虚假嫌疑大评论内容是指评论内容具有非常规特征,非常规特征包括评论内容的长度过长或过短、评价星级过低或过高、有价值的反馈过少和存在大量重复内容;将其它评论内容标注为“1”,利用人工对标记好的评论进行微调。3.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,所述步骤2,具体包括以下子步骤:步骤2.1:使用Word2Vec模型训练训练组和测试组,得到每个单词的向量表示,所有单词的向量表示成为字典;步骤2.2:基于步骤2.1中得到的向量表示进行映射,遍历训练组与测试组中的每一个单词,如果单词在字典中,则直接使用字典中对应的向量表示替换该单词;如果单词没有在词典中对应的向量表示,则将该单词丢弃;经过多次迭代将评论内容集和外部属性集分别转化为评论内容词向量和外部属性词向量,从而将单词的向量特征嵌入空间,为基于评论外部信息的虚假评论检测模型构建输入。4.根据权利要求1所述的一种基于评论外部信息的虚假评论检测方法,其特征在于,所述步骤3包括将步骤2中的训练组得到的外部属性词向量输入到卷积神经网络内,将步骤2中的训练组得到的评论内容词向量输入到加入注意力机制的长短期记忆网络内,...

【专利技术属性】
技术研发人员:田刚刘鹏飞任艳伟
申请(专利权)人:田刚
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1