一种异常评论文本的确定方法及装置制造方法及图纸

技术编号:18809969 阅读:27 留言:0更新日期:2018-09-01 09:26
本申请实施例提供了一种异常评论文本的确定方法及装置,其中,该方法包括:获取待异常评论的多条评论文本;计算所述多条评论文本之间的相似度;基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,确定所述异常分类评论文本集中的所有评论文本为所述异常评论文本。本申请实施例提高了异常评论的检测效率。

Method and device for determining abnormal comment text

The embodiment of the present application provides a method and apparatus for determining an abnormal comment text, wherein the method includes: obtaining a plurality of comment texts to be abnormal comment; calculating the similarity between the plurality of comment texts; classifying the plurality of comment texts based on the similarity, and obtaining a classified comment text set; For any categorized comment text set, the comment text corresponding to any categorized comment text set is input into a pre-trained emotional model, and the corresponding emotional score set of any categorized comment text set is obtained. Confirm all the comment text in the anomaly classification comment text set as the exception comment text. The application example improves the detection efficiency of abnormal reviews.

【技术实现步骤摘要】
一种异常评论文本的确定方法及装置
本申请涉及文本检测
,具体而言,涉及一种异常评论文本的确定方法及装置。
技术介绍
商品评论网站中存在大量的异常评论。异常评论会对顾客的行为产生影响,造成商家之间的恶意竞争,形成不好的商业氛围。异常评论主要包括虚假评论和极端评论。虚假评论是指用户对商家产品进行恶意鼓吹或者是诽谤。极端评论是指用户因个人情绪对商品做出不符合事实的评价。这两种评论都会影响商家的信用评价。现有的检测异常评论和极端评论的手段主要是通过人工识别,但是人工识别的难度较大,准确率较低,而且效率也很低。
技术实现思路
有鉴于此,本申请的目的在于提供了一种异常评论文本的确定方法及装置,以提高异常评论的检测效率。第一方面,本申请实施例提供了一种异常评论文本的确定方法,包括:获取待异常评论的多条评论文本;计算所述多条评论文本中任意两条评论文本之间的相似度;基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;对各所述分类评论文本集对应的情感分数集进行验证,本文档来自技高网...

【技术保护点】
1.一种异常评论文本的确定方法,其特征在于,包括:获取待异常评论的多条评论文本;计算所述多条评论文本中任意两条评论文本之间的相似度;基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,确定所述异常分类评论文本集中的所有评论文本为所述异常评论文本。

【技术特征摘要】
1.一种异常评论文本的确定方法,其特征在于,包括:获取待异常评论的多条评论文本;计算所述多条评论文本中任意两条评论文本之间的相似度;基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集;对于任一分类评论文本集,将该任一分类评论文本集对应的评论文本输入预先训练的情感模型,得到该任一分类评论文本集对应的情感分数集;对各所述分类评论文本集对应的情感分数集进行验证,获取异常分类评论文本集,确定所述异常分类评论文本集中的所有评论文本为所述异常评论文本。2.根据权利要求1所述的方法,其特征在于,所述计算所述多条评论文本中任意两条评论文本之间的相似度,包括:基于预设的相似度衡量模型,对任意一条评论文本进行向量转换,得到该任意一条评论文本的评论向量;计算任意两个评论向量之间的相似度。3.根据权利要求2所述的方法,其特征在于,所述基于所述相似度,对所述多条评论文本进行分类,得到分类评论文本集,包括:依据任意两个评论向量之间的相似度,确定该任意两个评论向量之间的向量距离;按照所述向量距离对所述多条评论文本进行分类,得到分类评论文本集。4.根据权利要求2所述的方法,其特征在于,所述基于预设的相似度衡量模型,对任意一条评论文本进行向量转换之前,所述方法还包括:对所述任意一条评论文本进行分词处理;过滤掉进行分词处理后的所述任意一条评论文本中的停用词,得到关键词。5.根据权利要求4所述的方法,其特征在于,所述基于预设的相似度衡量模型,对任意一条评论文本进行向量转换,得到该任意一条评论文本的评论向量,包括:对于任意一条评论文本,依次将该任意一条评论文本中的各关键词转换为对应的数字信息;基于依次转换得到的所述数字信息,生成该任意一条评论文本对应的评论向量。6.根...

【专利技术属性】
技术研发人员:徐振中肖依永苑星龙
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1