商品评论数据的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37668853 阅读:24 留言:0更新日期:2023-05-26 04:29
本申请提供了一种商品评论数据的处理方法、装置、电子设备及存储介质,通过检测商品的评论数据来判别是否为无效评论。该方法包括:获取与目标商品相对应的多条商品评论数据;确定目标商品的商品品类,以及与商品品类相对应的正向评论集合,正向评论集合中包括多个对隶属于商品品类的商品做出正面评价的评论;将多条商品评论数据与正向评论集合进行匹配,并将匹配成功的商品评论数据筛选为待检测的商品评论数据;获取与待检测的商品评论数据相对应的评论图片,检测评论图片中包含的商品的状态;若评论图片中包含的商品的状态为预设状态,确定待检测的商品评论数据为无效评论。确定待检测的商品评论数据为无效评论。确定待检测的商品评论数据为无效评论。

【技术实现步骤摘要】
商品评论数据的处理方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,特别涉及一种商品评论数据的处理方法、装置、电子设备及可读存储介质。

技术介绍

[0002]在网络购物时,个别商家会通过人工或技术手段来伪造、虚构订单以及商品好评信息,引诱消费者下单购买不符合质量或品质预期的商品。或者,有些用户针对商品做出的评论可能是不客观或不准确的。例如,有些用户在针对商品做出评论时,可能存在图片拍摄模糊、甚至拍摄对象错误等情况。由此可见,为了确保商品评论数据的有效性,需要对商品的评论数据进行分析和检测。
[0003]在相关技术中,通常使用大数据以及图论的方式,对交易信息数据、商品浏览和下单数据、店铺客服沟通信息以及商品评价数据等进行统计分析,该方式能够对非法公司、组织机构和专业人员伪造的订单及订单评论进行判定和处理。但是,由于无效评论的种类繁多,该方式无法有效甄别各种类型的无效评论。例如,该方式对于一些参与者分布广泛、电商交易行为相对正常的隐蔽性商业刷单行为,尤其是通过承诺返现来引诱用户伪造好评的方式,无法进行有效的探知和处理。

技术实现思路

[0004]本申请提供了一种商品评论数据的处理方法、装置、电子设备及可读存储介质,通过检测商品的评论数据来对无效评论进行识别和处理。
[0005]第一方面,本申请提供了一种商品评论数据的处理方法,包括:
[0006]获取与目标商品相对应的多条商品评论数据;
[0007]确定所述目标商品的商品品类,以及与所述商品品类相对应的正向评论集合,所述正向评论集合中包括多个对隶属于所述商品品类的商品做出正面评价的评论;
[0008]将所述多条商品评论数据与所述正向评论集合进行匹配,并将匹配成功的商品评论数据筛选为待检测的商品评论数据;
[0009]获取与所述待检测的商品评论数据相对应的评论图片,检测所述评论图片中包含的商品的状态;
[0010]若所述评论图片中包含的商品的状态为预设状态,确定所述待检测的商品评论数据为无效评论。
[0011]第二方面,本申请提供了一种商品评论数据的处理装置,包括:
[0012]获取模块,适于获取与目标商品相对应的多条商品评论数据;
[0013]处理模块,适于确定所述目标商品的商品品类,以及与所述商品品类相对应的正向评论集合,所述正向评论集合中包括多个对隶属于所述商品品类的商品做出正面评价的评论;
[0014]匹配模块,适于将所述多条商品评论数据与所述正向评论集合进行匹配,并将匹
配成功的商品评论数据筛选为待检测的商品评论数据;
[0015]检测模块,适于获取与所述待检测的商品评论数据相对应的评论图片,检测所述评论图片中包含的商品的状态;
[0016]判断模块,适于若所述评论图片中包含的商品的状态为预设状态,确定所述待检测的商品评论数据为无效评论。
[0017]第三方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
[0018]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述方法。
[0019]在本申请所提供的实施例中,获取与目标商品相对应的多条商品评论数据并确定目标商品的商品品类,然后获取与商品品类相对应的正向评论集合,再将多条商品评论数据与正向评论集合进行匹配,将匹配成功的商品评论数据筛选为待检测的商品评论数据。相应的,获取与待检测的商品评论数据相对应的评论图片,检测评论图片中包含的商品的状态,若评论图片中包含的商品的状态为预设状态,则确定待检测的商品评论数据为无效评论。由此可见,一方面,本申请首先确定目标商品的商品品类并获取与商品品类相对应的正向评论集合,然后将多条商品评论数据与正向评论集合进行匹配,将匹配成功的商品评论数据筛选为待检测的商品评论数据,与未进行正向评论集合匹配的商品评论数据相比,通过与商品品类相对应的正向评论集合来对多条商品评论数据进行匹配的方式,可以有效筛选出对商品质量做出正面评价的评论;另一方面,本申请获取与待检测的商品评论数据相对应的评论图片,检测评论图片中包含的商品的状态,若评论图片中包含的商品的状态为预设状态,则确定待检测的商品评论数据为无效评论。总之,由于评论图片中包含的商品的状态能够反映出商品的特定信息,例如,是否已拆封、实际商品与购买记录是否匹配等,所以通过判断好评评价的商品图片是否为预设状态可以有效筛选出无效评论。在具体实施时首先将商品评论数据与正向评论集合进行匹配,这样可以筛选出对商品质量做出正面评价的商品评论数据,然后再获取与筛选出的对商品质量做出正面评价的商品评论数据相对应的评论图片,最后通过判断评论图片中包含的商品的状态是否为预设状态来判断该条评价是否有效。如果评论图片被判断为预设状态,则可以判断该条评论为无效评论。
[0020]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请,并不构成对本申请的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0022]图1为本申请实施例提供的一种商品评论数据的处理方法的流程图;
[0023]图2为本申请实施例提供的另一种商品评论数据的处理方法的流程图;
[0024]图3为本申请实施例提供的一种商品评论数据的处理装置的结构示意图;
[0025]图4为本申请实施例提供的一种电子设备的框图。
具体实施方式
[0026]为使本领域的技术人员更好地理解本申请的技术方案,以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0027]在不冲突的情况下,本申请各实施例及实施例中的各特征可相互组合。
[0028]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0029]本文所使用的术语仅用于描述特定实施例,且不意欲限制本申请。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品评论数据的处理方法,其特征在于,包括:获取与目标商品相对应的多条商品评论数据;确定所述目标商品的商品品类,以及与所述商品品类相对应的正向评论集合,所述正向评论集合中包括多个对隶属于所述商品品类的商品做出正面评价的评论;将所述多条商品评论数据与所述正向评论集合进行匹配,并将匹配成功的商品评论数据筛选为待检测的商品评论数据;获取与所述待检测的商品评论数据相对应的评论图片,检测所述评论图片中包含的商品的状态;若所述评论图片中包含的商品的状态为预设状态,确定所述待检测的商品评论数据为无效评论。2.根据权利要求1所述的方法,其特征在于,所述与所述商品品类相对应的正向评论集合通过以下方式生成:针对多个商品品类,获取与所述商品品类对应的多条评论类型为正向类型的历史评论数据;将所述商品品类对应的每条历史评论数据执行分词处理以及词性标记处理,根据各个分词的词性,从所述历史评论数据中提取由情感特征词和描述对象词构成的正向评论单元,所述情感特征词用于表征评论的情感类型,所述描述对象词用于表征评论的对象;根据每个商品品类所对应的多个正向评论单元,生成与所述商品品类相对应的品类正向评论集合。3.根据权利要求2所述的方法,其特征在于,所述根据各个分词的词性,从所述历史评论数据中提取由情感特征词和描述对象词构成的正向评论单元包括:将词性为第一指定词性的分词提取为情感特征词;以所述情感特征词为基准,在当前历史评论数据中执行前向搜索和/或后向搜索,将搜索到的词性为第二指定词性的分词提取为描述对象词;将所述情感特征词和所述描述对象词组合为一个正向评论单元;其中,所述第一指定词性包括:形容词和/或副词;所述第二指定词性包括:名词和/或代词。4.根据权利要求3所述的方法,其特征在于,所述将搜索到的词性为第二指定词性的分词提取为描述对象词具体包括:将搜索到的词性为第二指定词性的分词与预设的过滤词表进行匹配,若匹配失败,则将搜索到的词性为第二指定词性的分词提取为描述对象词;其中,所述过滤词表用于存储与商品质量不相关的描述对象,包括:物流类词汇和/或售后服务类词汇。5.根据权利要求2所述的方法,其特征在于,所述根据每个商品品类所对应的多个正向评论单元,生成与所述商品品类相对应的品类正向评论集合包括:针对当前商品品类中的每个正向评论单元,计算所述正向评论单元在当前商品品类中的第一出现频次,以及所述正向评论单元在全部商品品类中的第二出现频次;根据所述第一出现频次与所述第二出现频次之间的比较结果,筛选若干正向评论单元添加至与当前商品品类相对应的品类正向评论集合中。
6.根据权利要求1所述的方法,其特征在于,所述预设状态...

【专利技术属性】
技术研发人员:乔宏利刘敏夏粉蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1