去除在线评论呈现顺序对评论帮助性干扰的纠偏方法及应用技术

技术编号:35370337 阅读:15 留言:0更新日期:2022-10-29 18:12
本发明专利技术公开了一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法及应用,通过构建包括呈现顺序和评论帮助性的面板数据集,并进行赋值;进行多期横截面数据收集并对相同评论进行评论关联;计算评论的新增投票,形成面板数据集;计算评论留存率和顺序稳定率;判断评论留存率和顺序稳定率是否满足要求;计算评论呈现顺序的系数;根据顺序偏误的影响作用大小,对评论帮助性进行误差纠正。本发明专利技术适用于在线平台对评论帮助性分析的改进,通过分析呈现顺序的信息,定量的刻画了来自浏览者的评论帮助性存在的系统偏误,通过偏误纠正有效的识别出高质量评论,从而降低消费者的信息过载。从而降低消费者的信息过载。从而降低消费者的信息过载。

【技术实现步骤摘要】
去除在线评论呈现顺序对评论帮助性干扰的纠偏方法及应用


[0001]本专利技术属于数据处理
,具体涉及一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法及应用。

技术介绍

[0002]随着电子商务市场的发展,在线平台越来越重视在线评论内容对消费者购买的帮助作用。为了降低海量评论信息给消费者带来的信息过载,平台通过收集浏览者投票的形式实现对评论质量的分析,并优先把高质量评论呈现给消费者。然而这种来自浏览者投票的信息不能完全反映评论的质量。由于排序靠后的评论可见性下降,同时带来的信息边际效用递减,评论收到的投票信息会受到呈现顺序的消极影响,导致基于投票信息的评论质量分析出现偏误。
[0003]因此需要一种技术,能够在投票信息的基础上去除呈现顺序带来的偏误,从而帮助平台更准确的估计评论的质量。

技术实现思路

[0004]为解决现有技术中存在的上述缺陷,本专利技术的目的在于提供一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,通过构建包含评论呈现顺序和评论帮助性的面板数据集,计算评论顺序偏误的影响作用大小,对评论帮助性进行误差纠正,从而帮助在线平台更准确的估计评论的质量。
[0005]本专利技术是通过下述技术方案来实现的。
[0006]本专利技术一方面,提供了一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,包括:
[0007]构建包括评论呈现顺序和评论帮助性的面板数据集;
[0008]分别设定评论收集窗口和评论收集间隔,对评论收集窗口和评论收集间隔赋值;/>[0009]进行多期横截面数据收集;
[0010]对相邻两期横截面数据的相同评论进行评论关联;
[0011]根据获得的相邻两期的评论关联关系,计算评论的新增投票,形成面板数据集;
[0012]利用面板数据集计算评论留存率和顺序稳定率;
[0013]判断评论留存率和顺序稳定率是否满足要求,如果不满足要求,则重新对收集间隔和收集窗口赋值;否则计算评论呈现顺序的系数;
[0014]对获得的面板数据集,计算评论呈现顺序的系数;
[0015]利用评论呈现顺序系数调整评论帮助性,得到纠偏后的评论帮助性。
[0016]优选的,对评论收集窗口和评论收集间隔赋值,第一次赋初始值根据工程分析的要求预设;若上一次得到的评论留存率不满足要求,则扩大收集窗口;若上一次得到的顺序稳定率不满足要求,则缩小收集间隔;收集窗口的扩大量和收集间隔的缩小量根据工程分析的要求预设。
[0017]优选的,横截面数据收集包含三个维度:产品、评论和期数;收集的数据包含四个类型:总投票数、呈现顺序、评论文本和控制变量;数据收集的总期数根据工程分析要求预设;控制变量包含的变量根据工程分析要求预设。
[0018]优选的,相邻两期评论关联是指对相邻两期的评论集基于评论文本进行相同评论识别。
[0019]优选的,对评论留存率和顺序稳定率的要求为大于给定阈值,评论留存率和顺序稳定率的给定阈值根据工程分析的要求预设。
[0020]优选的,对获得的面板数据集Ω,使用最小二乘法回归计算评论呈现顺序的系数。
[0021]本专利技术再一方面,提供了一种所述方法在电子商务在线平台中应用。
[0022]本专利技术由于采取以上技术方案,其具有以下有益效果:
[0023]1.降低消费者信息过载。本专利技术由于采用了对获得的面板数据集,计算评论呈现顺序的系数,实现了对来自浏览者投票的评论帮助性与评论真实质量之间存在的系统偏误的定量刻画。
[0024]2.利用评论呈现顺序系数调整评论帮助性的偏误纠正方法,实现了对高质量评论的有效识别,从而降低消费者的信息过载。
[0025]3.具有很强的分析层次迁移性。本方法可以应用于平台级的评论呈现顺序对其帮助性的偏误调整,也可在产品类别级和产品级应用,具有灵活的可迁移性。
附图说明
[0026]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的不当限定,在附图中:
[0027]图1是本专利技术实施例的去除呈现顺序对在线评论的帮助性干扰的纠偏算法流程图。
具体实施方式
[0028]下面将结合附图以及具体实施例来详细说明本专利技术,在此本专利技术的示意性实施例以及说明用来解释本专利技术,但并不作为对本专利技术的限定。
[0029]图1是本专利技术实施例的去除在线评论呈现顺序对评论帮助性干扰的纠偏方法流程图。通过构建包含评论呈现顺序和评论帮助性的面板数据集,计算评论顺序偏误的影响作用大小,实现对评论帮助性进行误差纠正。评论帮助性为一条评论收到来自浏览者的点赞数;评论呈现顺序为一条评论在页面中呈现给浏览者的顺序变量;顺序偏误为评论呈现顺序对评论收到的点赞数的影响。
[0030]本专利技术纠偏方法包括以下步骤:
[0031]步骤1,构建包含评论呈现顺序和评论帮助性的面板数据集。
[0032]首先,分别设定评论收集窗口和评论收集间隔,对评论收集窗口和评论收集间隔赋值。
[0033]第一次赋初始值,赋值根据工程分析的要求预设;迭代解算时根据前一次执行步骤5计算的评论留存率和顺序稳定率进行修正。
[0034]在迭代时对收集窗口和收集间隔的调整方式为,若上一次根据步骤6判断得到的
评论留存率不满足要求,则扩大收集窗口;若上一次根据步骤6判断得到的顺序稳定率不满足要求,则缩小收集间隔;收集窗口的扩大量和收集间隔的缩小量根据工程分析的要求预设。
[0035]步骤2,按照步骤1设定的收集窗口与收集间隔收集多期横截面数据。
[0036]横截面数据收集包含三个维度:{i,j,t}。其中i=1,2,...,I代表评论,I为收集窗口中一个产品的评论总数;j=1,2,...,J代表产品,J为收集的产品总数,根据工程分析的要求预设;t=1,2,...,T代表期数,T为收集的横截面数据总期数,根据工程分析的要求预设。
[0037]收集的数据包含以下四个类型:{votes
ijt
,order
ijt
,text
ij
,controls
ijt
},其中votes
ijt
是产品j的评论i截止第t期收到的总投票数,为序数变量;order
ijt
是产品j的评论i在第t期的呈现顺序,为序数变量;text
ij
是产品j的评论i的评论文本内容,为字符串变量;controls
ijt
是产品j的评论i在第t期的控制变量,可包含多个数值变量,根据工程分析的要求预设。
[0038]步骤3,根据获得的多期横截面数据,对相邻两期横截面数据的评论关联。对相邻两期的评论集基于评论文本text
ij
进行相同评论识别。
[0039]步骤4,根据获得的相邻两期的评论关联关系,计算评论的新增投票,构建面板数据集。
[0040]利用相邻两期的评论关联本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,其特征在于,包括:构建包括评论呈现顺序和评论帮助性的面板数据集;分别设定评论收集窗口和评论收集间隔,对评论收集窗口和评论收集间隔赋值;进行多期横截面数据收集;对相邻两期横截面数据的相同评论进行评论关联;根据获得的相邻两期的评论关联关系,计算评论的新增投票,形成面板数据集;利用面板数据集计算评论留存率和顺序稳定率;判断评论留存率和顺序稳定率是否满足要求,如果不满足要求,则重新对收集间隔和收集窗口赋值;否则计算评论呈现顺序的系数;对获得的面板数据集,计算评论呈现顺序的系数;利用评论呈现顺序系数调整评论帮助性,得到纠偏后的评论帮助性。2.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,其特征在于,对评论收集窗口和评论收集间隔赋值,第一次赋初始值根据工程分析的要求预设;若上一次得到的评论留存率不满足要求,则扩大收集窗口;若上一次得到的顺序稳定率不满足要求,则缩小收集间隔;收集窗口的扩大量和收集间隔的缩小量根据工程分析的要求预设。3.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,其特征在于,横截面数据收集包含三个维度:产品、评论和期数;收集的数据包含四个类型:总投票数、呈现顺序、评论文本和控制变量;数据收集的总期数根据工程分析要求预设;控制变量包含的变量根据工程分析要求预设。4.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,其特征在于,相邻两期评论关联是指对相邻两期的评论集基于评论文本进行相同评论识别。5.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,其特征在于,计算评论的新增投票y
ijt
,根据下式计算形成面板数据集Ω:y
ijt
=votes
ij(t+1)

votes
ijt
面板数据集Ω中每一条观测值包括:{y
ijt
,order
ijt
,votes
ijt
,text
ijt
,controls
ijt
},其中t=1,2,...T

1;其中,votes
ijt
是产品j的评论i截止第t期收到的总投票数,为序数变量...

【专利技术属性】
技术研发人员:孙新宇张延王嘉寅潘磊
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1