【技术实现步骤摘要】
一种电商网站中评论质量的检测方法
本专利技术涉及一种基于评论人个体和群组的评论评价模型及模糊聚类方法,尤其涉及一种电子商务网站评论质量的检测方法,属于计算机技术应用领域。
技术介绍
随着互联网技术的发展和普及,以信息和数据为主体的时代逐渐走入百姓生活,一种在互联网上以电子交易进行购物的方式被广泛青睐。电子商务网站作为网络购物的主要渠道,积累了购买用户的大量商品评论信息,评论信息作为网络口碑的表现形式之一,其质量好坏对用户的消费决策影响不言而喻。然而,随着电子商务网站评论的积累以及商业利益的驱使,网站中出现大量无意义甚至虚假的评论。如何采用技术手段针对电子商务网站的评论质量进行检测,去伪存真以提升网络购物平台的信誉度,成为当下亟待解决的任务之一。检测电子商务网站评论的目的是识别其中的虚假评论。虚假评论,指一些交易者出于谋求私利的不良动机,在评论中编造不实消费经历、对评价对象的质量等进行鼓吹或诽谤,以误导消费者的消费行为。电子商务网站中虚假评论产生的案例举例如下:案例1:在某电子商务平台,用户A已经购买过一些商品 ...
【技术保护点】
1.一种电商网站中评论质量的检测方法,其特征在于,包括:/n商家对评论人的评分机制:定义反映评论人的特征为:登录:异地登陆和频繁登录;浏览:购买前浏览同类商品;评论:购买后给出商品评价三类行为的计算规则;/n在每次交易中,商家将评论人的上述三类行为,出现标记1,未出现标记0,有8种组合,定义001,101,111为可疑交易,其余值为正常交易;/n定义X分制,根据n次交易中正常交易的概率p_1,计算出商家评分X*p_1作为第一类特征,根据特征构建评论人特征向量;/n评论人用一个向量表示:u=(1,u_feature_1,u_feature_2,…,u_feature_k),向 ...
【技术特征摘要】
1.一种电商网站中评论质量的检测方法,其特征在于,包括:
商家对评论人的评分机制:定义反映评论人的特征为:登录:异地登陆和频繁登录;浏览:购买前浏览同类商品;评论:购买后给出商品评价三类行为的计算规则;
在每次交易中,商家将评论人的上述三类行为,出现标记1,未出现标记0,有8种组合,定义001,101,111为可疑交易,其余值为正常交易;
定义X分制,根据n次交易中正常交易的概率p_1,计算出商家评分X*p_1作为第一类特征,根据特征构建评论人特征向量;
评论人用一个向量表示:u=(1,u_feature_1,u_feature_2,…,u_feature_k),向量中的参数表示量化后评论人特征值,初始值包括:u_feature_1=“商家评分”、u_feature_2=“注册时间”、u_feature_k=空值;
评论人对商家的评分机制:定义反映商家的特征为:商品:描述相符;服务:服务态度;物流:物流情况三类属性的计算规则;
在每次交易中,评论人将商家的上述三类属性,优标记1,差标记0,有8种组合,定义000,001,010,100为劣质交易,其余值为优质交易;
定义X分制,根据n次交易中优质交易的概率p_2,计算出评论人评分X*p_2作为第一类特征,根据特征构建商家特征向量;
商家用一个向量表示:m=(1,m_feature_1,m_feature_2,…,m_feature_k),向量中的参数表示量化后商家特征值,初始值包括:m_feature_1=“评论人评分”、m_feature_2=“注册时间”、m_feature_k=空值;
对评论人、商家特征集合中分布值的讨论和筛选是进行统计分析的参考值,因此,需要对特征集合中的数值进行归一化处理,并将处理后的数据输入到逻辑回归模型中;
由于特征集合存在上限和下限,满足级数规划的基本特征,根据函数项级数的一致收敛性质,建立收敛模型Sn(x)=xn/(xn+Range),Range定义为特征范围的最大值,自变量x为限定范围的特征集合,Sn(x)的部分和序列S(x)在自变量区间(0,Range)上一致收敛至1;
再根据Range的取值,选取初始化的n值,使取值范围内所有特征值逼近归一化(0,1)区间,获得特征数据处理后的结果;
将归一化后的目标特征值组合为目标特征向量,即各个评论人和商家的特征向量;
采用统计分析标注法,在设定的特征向量集合中挖掘出符合条件的特征向量,并标注出类别,作为逻辑回归的训练集;
逻辑回归训练集数据中自变量为量化归一后的评论人特征,因变量为已标注的评论人类别且服从伯努利分布,标记真实评论人为1,虚假评论人为0;
评论人训练集特征矩阵表示为U={u_1,u_2,…,u_n},其中u_i为第i个样本的(k+1)维特征向量,训练集标注结果用一个n维0,1向量表示;
采用最大似然估计原理和批量梯度下降法求出一组(k+1)维回归系数向量α,评论人的真实度表示为URE=1/[1+exp(-αT*u)];
逻辑回归训练集数据中自变量为量化归一后的商家特征,因变量为已标注的商家类别且服从伯努利分布,标记真实商家为1,虚假商家为0;
商家训练集特征矩阵以M={m_1,m_2,…,m_n}表示,其中m_i为第i个样本的(k+1)维特征向量,训练集标注结果用一个n维0,1向量表示;
采用最大似然估计原理和批量梯度下降法求出一组(k+1)维回归系数向量β,商家的真实度表示为MRE=1/[1+exp(-βT*u)];
根据“共同评论大于等于三个商家的评论人为一个群组”准则,将所述需要检测的评论人划分为个体评论人和群组评论人;
个体评论人评价模型:个体评论人定义为个体,具...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。