关联度的处理方法、装置和存储介质制造方法及图纸

技术编号:24331426 阅读:27 留言:0更新日期:2020-05-29 19:45
本发明专利技术提供一种关联度的处理方法、装置和存储介质,该方法包括:接收关联度处理请求,关联度处理请求包括当前时间段的待处理用户的关联用户的数量;根据待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取待处理用户在当前时间段的置信度;根据待处理用户在当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取待处理用户在当前时间段的矫正参数;根据待处理用户在上一个时间段的合并关联度、当前关联度、当前关联度的权重,以及,矫正参数,获取待处理用户在当前时间段的合并关联度。本发明专利技术获取的合并关联度更加贴切用户真实的关系强度,且具有普适性。

Processing method, device and storage medium of correlation degree

【技术实现步骤摘要】
关联度的处理方法、装置和存储介质
本专利技术涉及互联网
,尤其涉及一种关联度的处理方法、装置和存储介质。
技术介绍
无论是在物理世界中还是互联网中,用户与其他用户之间存在着纷繁复杂的关系网络。任何两个用户之间的关系强度为关联度,按照关联度将用户连接起来就构成了用户关系网络。在用户关系网络角度进行用户与用户的特征分析与刻画,会更加贴近现实世界,能够实现对用户个性化的服务,提高对用户的服务质量,具有巨大的应用价值。而要构建用户关系网络并进行网络分析就需要先进行关联度的计算。用户每天都在与移动应用进行交互,不断有新数据的产出,千亿级别的数据全量参与关联度的计算代价很大,甚至由于数据规模极过大,导致计算无法开展。因此,用户间关联度的计算就需要进行分批次分时间段进行(比如按月处理),然后将不同时间段计算得到关联度按照时间排序,得到用户的关联度时序序列,将用户关联度时序序列进行合并,得到用户关联度的最终分值。用户数据是随着时间不断产生的,当新数据产出时,可以计算得到当前时间段内的用户关联度,这样整合历史关联度与当前时段关联度就可以实现关联度合并迭代计算,计算量小且将历史信息与当前信息进行了整合,可实践性强。现有技术中,对历史关联度和当前时段关联度进行关联度合并的方法主要包括:平均值法,指数平滑法、自回归-移动平均法等;平均值法是将从历史某个时间段至当前时间段的关联度进行加权平均,获取当前时间段的合并关联度;指数平滑法是按照某个固定的权重将前一时间段的合并关联度与当前时间段的关联度进行合并;自回归-移动平均法是对不同的用户数据进行训练,获取每个用户的关联度误差系数,根据该关联度误差系数、历史时间段的关联度获取当前时间段的合并关联度。但现有技术中的关联度合并方法存在获取的合并关联度不准确的问题;用户的关联度数据具有波动性,平均值法、指数平滑法会把有意义的信息(如历史高分关联度)掩盖,对数据的变化趋势不够敏感;自回归-移动平均法需要对不同的用户训练得到不同的关联度误差系数结果,不适合对所有用户关联对构建通用模型。
技术实现思路
本专利技术提供一种关联度的处理方法、装置和存储介质,本专利技术获取的合并关联度更加贴切用户真实的关系强度,且针对每个用户均适用,具有普适性。本专利技术的第一方面提供一种关联度的处理方法,包括:接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度。可选的,所述获取所述待处理用户在所述当前时间段的合并关联度之前,还包括:获取所述待处理用户在所述当前时间段的当前关联度。可选的,所述获取所述处理用户在所述当前时间段的当前关联度,包括:获取所述待处理用户在所述当前时间段的不同属性的多个关联度;根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。可选的,所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数;所述获取所述待处理用户在所述当前时间段的合并关联度,包括:根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度;其中,获取所述待选合并关联度X'i+n具体如下公式所示:其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。可选的,所述获取所述待处理用户在所述当前时间段的当前关联度之后,还包括:确定所述当前关联度是否为0;若是,则将所述空值确定为0;若否,则将所述空值确定为1。可选的,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;所述获取当前时间段的待处理用户的关联用户的数量,包括:将所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。可选的,所述根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度之前,还包括:根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。可选的,所述根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数之前,还包括:根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。可选的,所述方法还包括:若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。本专利技术的第二方面提供一种关联度的处理装置,包括:接收模块,用于接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;置信度获取模块,用于根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;矫正参数获取模块,用于根据所述待处理用本文档来自技高网
...

【技术保护点】
1.一种关联度的处理方法,其特征在于,包括:/n接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;/n根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;/n根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;/n根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度。/n

【技术特征摘要】
1.一种关联度的处理方法,其特征在于,包括:
接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用户的关联用户的数量;
根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度;
根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数,所述矫正参数用于对所述待处理用户在所述当前时间段的当前关联度的权重进行校正,所述当前关联度用于表示所述待处理用户在所述当前时间段的用户关系强度;
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述当前关联度的权重,以及,所述矫正参数,获取所述待处理用户在所述当前时间段的合并关联度,所述合并关联度用于表示所述待处理用户在第一个时间段至所述合并关联度对应的时间段的用户关系强度。


2.根据权利要求1所述的方法,其特征在于,所述获取所述待处理用户在所述当前时间段的合并关联度之前,还包括:
获取所述待处理用户在所述当前时间段的当前关联度。


3.根据权利要求2所述的方法,其特征在于,所述获取所述处理用户在所述当前时间段的当前关联度,包括:
获取所述待处理用户在所述当前时间段的不同属性的多个关联度;
根据每个属性的关联度对应的转化关系,将所述当前时间段的待处理用户的不同属性的多个关联度分别转化为相同属性的多个关联度;
将所述相同属性的多个关联度的加和确定为所述待处理用户在所述当前时间段的当前关联度。


4.根据权利要求1所述的方法,其特征在于,所述当前关联度的权重为权重参数,所述权重参数包括:平滑系数、空值衰减系数和空值,所述待处理用户在所述当前时间段的矫正参数包括:当前平滑系数校正参数和当前空值衰减系数校正参数;
所述获取所述待处理用户在所述当前时间段的合并关联度,包括:
根据所述待处理用户在上一个时间段的合并关联度、所述当前关联度、所述平滑系数、所述空值衰减系数和所述空值,所述当前平滑系数校正参数和所述当前空值衰减系数校正参数,获取所述待处理用户在所述当前时间段的待选合并关联度;其中,获取所述待选合并关联度X'i+n具体如下公式所示:



其中,α为所述平滑系数,θi+n为所述当前平滑系数校正参数,δ为所述空值衰减系数,为所述当前空值衰减系数校正参数,x'i+n为所述当前关联度,Xi+n-1为所述待处理用户在上一个时间段的合并关联度,i为所述待处理用户的关联度的第一个时间段,n为大于0的整数,λi+n为所述空值;
将所述待选合并关联度和所述当前关联度中的最大值确定为所述待处理用户在当前时间段的合并关联度。


5.根据权利要求4所述的方法,其特征在于,所述获取所述待处理用户在所述当前时间段的当前关联度之后,还包括:
确定所述当前关联度是否为0;
若是,则将所述空值确定为0;
若否,则将所述空值确定为1。


6.根据权利要求1所述的方法,其特征在于,所述待处理用户包括第一用户和第二用户,所述待处理用户在上一个时间段的合并关联度用于表示所述第一用户和所述第二用户,在所述第一个时间段至所述上一个时间段的关系强度,所待处理用户的当前关联度用于表示所述第一用户和所述第二用户在所述当前时间段的关系强度;所述当前时间段的待处理用户的关联用户的数量包括:所述第一用户的关联用户的第一数量和所述第二用户的关联用户的第二数量;
所述当前时间段的待处理用户的关联用户的数量为:所述第一数量和所述第二数量的加和确定为所述待处理用户的关联用户的数量。


7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述待处理用户的关联用户的数量,以及,关联用户的数量与置信度的对应关系,获取所述待处理用户在所述当前时间段的置信度之前,还包括:
根据每个样本用户的关联用户的数量,以及,每个所述样本用户的置信度,训练置信度模型,所述置信度模型用于确定关联用户的数量与置信度的对应关系。


8.根据权利要求7所述的方法,其特征在于,所述根据所述待处理用户在所述当前时间段的置信度,以及,置信度与矫正参数的对应关系,获取所述待处理用户在所述当前时间段的矫正参数之前,还包括:
根据每个所述样本用户的置信度,以及,每个所述样本用户的矫正参数,训练矫正参数模型,所述矫正参数模型用于确定置信度与矫正参数的对应关系。


9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述上一个时间段为获取所述待处理用户的关联度的第一个时间段,则将所述第一个时间段的关联度确定为所述待处理用户在上一个时间段的合并关联度。


10.一种关联度的处理装置,其特征在于,包括:
接收模块,用于接收关联度处理请求,所述关联度处理请求包括当前时间段的待处理用...

【专利技术属性】
技术研发人员:窦亚光成亚雄谷松
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1