一种基于子图挖掘的信用炒作与恶意评价识别方法技术

技术编号:19143165 阅读:49 留言:0更新日期:2018-10-13 09:08
本发明专利技术提供了一种基于子图挖掘的信用炒作与恶意评价识别方法,其特征在于,包括以下步骤:将对商品的评价划分为好评及差评;建立每个商品的半二类网络;对半二类网络进行分析。本发明专利技术基于在线商品评价,能够在海量评价数据集中,基于商品间的特定联系构建半二分类网络,并通过网络统计分析与子图挖掘实现信用炒作与恶意评价的识别。此方案对于规范电商平台的正常运营、促进商品公平竞争、为消费者提供正确的购物指引等都具有实践意义与应用价值。

A method of credit speculation and malicious evaluation based on Subgraph Mining

The invention provides a method for identifying credit speculation and malicious evaluation based on subgraph mining, which is characterized by the following steps: dividing the evaluation of commodities into good and bad comments; establishing a semi-second class network for each commodity; and analyzing a semi-second class network. Based on online commodity evaluation, the invention can construct a semi-binary classification network based on the specific relationship between commodities in a mass evaluation data set, and realize the identification of credit speculation and malicious evaluation through network statistical analysis and sub-graph mining. This scheme has practical significance and application value for standardizing the normal operation of e-commerce platform, promoting fair competition of commodities, and providing consumers with correct shopping guidelines.

【技术实现步骤摘要】
一种基于子图挖掘的信用炒作与恶意评价识别方法
本专利技术面向在线商品的评价数据,旨在通过含多重连接的半二类网络建模与子图挖掘来识别不合理评价,包括信用炒作与恶意评价,从而规范商品易后反馈与商品推荐市场,促进互联网环境的公平公正化建设,属于网络节点发现或模式识别领域。
技术介绍
目前已有多篇关于对信用炒作与恶意评价进行识别的方法。例如:申请号为CN201510314327.0的专利,利用信息传递技术扩大有效信用评分,降低虚假评价,让货主会员(为方便说明下文以货主会员A代称)得到更贴合自身需求的车辆会员(为方便说明下文以车辆会员C代称)信用状况。从平台数据库提取货主会员A的注册信息、交易信息和朋友圈信息等相关基本交互信息,挖掘货主会员A关于车辆会员C的直接信任圈,包括与车辆会员C发生过交易行为的货主会员A的朋友圈、与车辆会员C发生过交易行为的资历老信用等级高的大V货主(包括平台运货量大且稳定的大企业、高级会员等大会员货主)两类,这两类货主会员与货主会员A有着直接信任关系,他们的评价信息是货主会员A最具参考价值的信用信息。申请号为CN201710889243.9的专利,公开了一种防刷单的方法,包括服务器和客户端,该方法应用于服务器。判断所述指定书籍的点击通过率与该书籍的近期购买量是否成正相关关系;若否,则确定所述异常行为属于刷单行为;若是,则确定所述异常行为不属于刷单行为。”申请号为CN201710719176.6的专利,公开了以下技术方案:刷单行为是指书籍的作者或其他利益所得者通过聘人来刷指定书籍的点击量,提升该书籍所在书籍区块的点击通过率,进而使得排在较靠后的书籍区块的点击通过率比靠前的书籍区块的点击通过率高很多,从而使分布曲线的整体趋势与衰减类型的函数曲线的整体趋势不符。申请号为CN201510555824.X的专利,公开了以下技术方案:根据软件的评论信息的相似度或信息增益,计算软件的评论信息的平均相似度或平均信息熵;根据同一类别的每个软件各自对应的平均相似度或平均信息熵,计算得到该同一类别的软件对应的概率统计分布参数;根据该同一类别的软件对应的概率统计分布参数设置同一类别的软件对应的判定阈值范围,该判定阈值范围是用于判定小概率事件的阈值范围;当待检测软件的评论信息的平均相似度或平均信息熵落入该待检测软件所属类别的软件对应的判定阈值范围时,则判定该待检测软件是刷好评推广作弊软件。申请号为CN201710889243.9的专利、申请号为CN201510555824.X的专利以及申请号为CN201510555824.X的专利通过一到两个物理量的全局相关性或分布不同来甄别炒作评价。申请号为CN201710520270.9的专利,公开了以下技术方案:本专利技术的目的在于克服现有技术的不足,提供能有效地避免刷单刷好评或恶意差评给评价排序带来的影响、利于用户在消费时对商品的质量有个较明确的认识、有助于电商平台对商户的管理、一定程度上保证出现在该平台上的商品质量、利于电商平台的健康发展的基于区块链的评价排序方法。此专利通过改进评价方式,即去中心化、引入交易成本,来避免出现不实好评,其价值体现在防患阶段。申请号为CN201610048237.6的专利公开了如下技术方案:根据时间窗win内的多次评价满意度,用户实体ci对服务实体sj的反馈可信度由以下公式得出:时间窗win内与用户实体ci进行交易的服务实体集为:P={s1,......,sn},用户实体ci的最终评价可信度为:根据所有用户对服务的交易信任度能够得出此服务实体的信誉度,将之前求得的用户评价可信度作为相应的权重。申请号为CN201510784757.9的专利公开了如下技术方案:根据商品类型树以及各个用户之间的交易商品信息计算每个信任情境组合的相似度;根据各个用户对各自交易商品的商品特征的评价信息计算每两个用户对共同交易伙伴的信任倾向之间的相似度;根据所述每一组信任情境的相似度以及所述每两个用户对共同交易伙伴的信任倾向之间的相似度计算每组潜在交易组合之间的间接信任度;根据所述每组潜在交易组合之间的间接信任度确定推荐关系;结合用户之间购买商品类型的相似性以及用户对商品的评价的相似性来考虑用户之间的推荐是否可信,能够抵恶意评价的欺骗攻击、降低信任风险以及提升推荐的个性化。申请号为CN200810171773.0的专利公开了如下技术方案:将所有的针对一个评价对象的原始信用数据分为两个集合,其中,任意一个集合中的任意一个原始信用数据与同集合中的其他原始信用数据之间的差异不大于所述任意一个集合中的任意一个原始信用数据与另一个集合中的原始信用数据之间的差异;根据预先设置的规则,过滤掉其中一个集合中的所有原始信用数据,保留另一个集合中的所有原始信用数据。申请号为CN201610048237.6的专利、申请号为CN200810171773.0的专利及申请号为CN200810171773.0的专利皆从评价数据入手,主要是通过设置信任函数来判定某差评是否是恶意的。对比分析发现,现有技术主要从防范与甄别两个角度入手,而甄别的主要技术手段是分析评价文本并监测其信息增益,并以信息熵均值为阈值作过滤与识别。文本分析属于自然语言处理范畴,一般需要借助支持向量机(SVM)、深度学习等模型,可解释性差而复杂度高。
技术实现思路
本专利技术的目的是:降低对信用炒作与恶意评价进行识别的算法的复杂度,同时提高识别精度。为了达到上述目的,本专利技术的技术方案是提供了一种基于子图挖掘的信用炒作与恶意评价识别方法,其特征在于,包括以下步骤:第一步、将对商品的评价(五星或好中差三级)划分为好评G及差评B,第r位评价者对第i个商品的好评为EirG,第r位评价者对第i个商品的差评为EirB,将EirG与EirB分别赋值为不同的常数;获得每个商品的同源商品、同类商品及互补商品;第二步、建立所有评价者与商品的半二类网络,包括评价者节点及商品节点,依据评价者对同源商品、同类商品及互补商品的好评G及差评B,建立评价者节点及商品节点之间的连接;第三步、对半二类网络进行分析,获得:第i个商品的期望评价Ei,Ei=k∑rEirG+(1-k)∑rEirB,k为好评的权重;第i个商品的好评差评比Ri;第r位评价者的总体期望评价Er,Er=k∑iEirG+(1-k)∑iEirB;第r位评价者的好评差评比Rr;第r位评价者对第i个商品的重复评价次数为Cire,若:1)给定第i个商品及其期望评价Ei,若第r位评价者给出评价e满足||Ei-el|>θi,θi为预先设定的阈值,则将第r位评价者判定为疑似不合理评价者;2)给定第r位评价者及其对第i个商品的评价e,若Cire>θir,θir为预先设定的阈值,则将为第r位评价者判定为疑似不合理评价者;3)给定第r位评价者及其好评差评比Rr,若Rr>θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似信用炒作者;4)给定第r位评价者及其好评差评比Rr,若1/Rr>1/θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似恶意评价者;第四步、子图挖掘1)对于判定为疑似信用炒作者的评价者,统计与该评价者有关的所有LGS型子图,LGS型子图为评价者节点对商品节点中当前商品及同源商品均作出好评G的L形连本文档来自技高网
...

【技术保护点】
1.一种基于子图挖掘的信用炒作与恶意评价识别方法,其特征在于,包括以下步骤:第一步、将对商品的评价划分为好评G及差评B,第r位评价者对第i个商品的好评为EirG,第r位评价者对第i个商品的差评为EirB,将EirG与EirB分别赋值为不同的常数;获得每个商品的同源商品、同类商品及互补商品;第二步、建立所有评价者与商品的半二类网络,包括评价者节点及商品节点,依据评价者对同源商品、同类商品及互补商品的好评G及差评B,建立评价者节点及商品节点之间的连接;第三步、对半二类网络进行分析,获得:第i个商品的期望评价Ei,Ei=k∑rEirG+(1‑k)∑rEirB,k为好评的权重;第i个商品的好评差评比Ri;第r位评价者的总体期望评价Er,Er=k∑iEirG+(1‑k)∑iEirB;第r位评价者的好评差评比Rr;第r位评价者对第i个商品的重复评价次数为Cire,若:1)给定第i个商品及其期望评价Ei,若第r位评价者给出评价e满足||Ei‑e||>θi,θi为预先设定的阈值,则将第r位评价者判定为疑似不合理评价者;2)给定第r位评价者及其对第i个商品的评价e,若Cire>θir,θir为预先设定的阈值,则将为第r位评价者判定为疑似不合理评价者;3)给定第r位评价者及其好评差评比Rr,若Rr>θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似信用炒作者;4)给定第r位评价者及其好评差评比Rr,若1/Rr>1/θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似恶意评价者;第四步、子图挖掘1)对于判定为疑似信用炒作者的评价者,统计与该评价者有关的所有LGS型子图,LGS型子图为评价者节点对商品节点中当前商品及同源商品均作出好评G的L形连接关系的子图,若疑似信用炒作者评价过的商品的数量大于2,且其LGS型子图的个数大于θL时,θL为预先设定的阈值,将疑似信用炒作者判断为信用炒作者;2)对于判定为疑似恶意评价者的评价者,统计与该评价者有关的所有LBA型子图,LBA型子图为评价者节点对商品节点中当前商品及同类商品均作出差评B的L形连接关系的子图,若疑似恶意评价者评价过的商品的数量大于2,且其LBA型子图的个数大于θL时,将疑似恶意评价者判断为恶意评价者;3)对于判定为疑似不合理评价者的评价者,统计与该评价者有关的LGC型子图,LGC型子图为评价者节点对商品节点中同类商品及互补商品均作出好评G的L形连接关系的子图,若疑似不合理评价者评价过的商品的数量大于2,且其LGC型子图的个数大于θL时,将疑似不合理评价者判断为不合理评价者;4)对于任意评价者,统计与该评价者有关的所有ΔGGS型子图,ΔGGS型子图为两个具有同源关系的商品同时被同一个评价者节点给予好评G的三角形子图,若ΔGGS型子图的个数大于θΔ时,θΔ为预先设定的阈值,将当前评价者判定为信用炒作者;5)对于任意评价者,统计与该评价者有关的所有ΔBBA型子图,ΔBBA型子图为两个具有同类关系的商品同时被同一个评价者节点给予差评B的三角形子图,若ΔBBA型子图的个数大于θΔ时,将当前评价者判定为恶意评价者;6)对于任意评价者,统计与该评价者有关的所有ΔGBA型子图,ΔGBA型子图为两个具有同类关系的商品同时被同一个评价者节点评价,其中一个为好评G,另外一个为差评B的三角形子图,若ΔGBA型子图的个数大于θΔ时,将当前评价者判定为信用炒作者兼恶意评价者。...

【技术特征摘要】
1.一种基于子图挖掘的信用炒作与恶意评价识别方法,其特征在于,包括以下步骤:第一步、将对商品的评价划分为好评G及差评B,第r位评价者对第i个商品的好评为EirG,第r位评价者对第i个商品的差评为EirB,将EirG与EirB分别赋值为不同的常数;获得每个商品的同源商品、同类商品及互补商品;第二步、建立所有评价者与商品的半二类网络,包括评价者节点及商品节点,依据评价者对同源商品、同类商品及互补商品的好评G及差评B,建立评价者节点及商品节点之间的连接;第三步、对半二类网络进行分析,获得:第i个商品的期望评价Ei,Ei=k∑rEirG+(1-k)∑rEirB,k为好评的权重;第i个商品的好评差评比Ri;第r位评价者的总体期望评价Er,Er=k∑iEirG+(1-k)∑iEirB;第r位评价者的好评差评比Rr;第r位评价者对第i个商品的重复评价次数为Cire,若:1)给定第i个商品及其期望评价Ei,若第r位评价者给出评价e满足||Ei-e||>θi,θi为预先设定的阈值,则将第r位评价者判定为疑似不合理评价者;2)给定第r位评价者及其对第i个商品的评价e,若Cire>θir,θir为预先设定的阈值,则将为第r位评价者判定为疑似不合理评价者;3)给定第r位评价者及其好评差评比Rr,若Rr>θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似信用炒作者;4)给定第r位评价者及其好评差评比Rr,若1/Rr>1/θr,θr为预先设定的阈值,则将为第r位评价者判定为疑似恶意评价者;第四步、子图挖掘1)对于判定为疑似信用炒作者的评价者,统计与该评价者有关的所有LGS型子图,LGS型子图为评价者节点对商品节点中当前商品及同源商品均作出好评G的L形连接关系的子图,若疑似信用炒作者评价过的商品的数量大于2,且其LGS型子图的个数大于θL时,θL为预先设定的阈值,将疑似信用炒作者判断为信用炒作者;2)对于判定为疑...

【专利技术属性】
技术研发人员:李建敦
申请(专利权)人:上海电机学院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1