基于超长行为序列的建模方法及装置、终端、存储介质制造方法及图纸

技术编号:27295919 阅读:22 留言:0更新日期:2021-02-06 12:05
本申请实施例公开了一种基于超长行为序列的建模方法,包括:获取目标用户在特定时间段内的超长行为序列;根据所述超长行为序列,生成至少两个短期行为序列;对所述至少两个短期行为序列进行合并处理,得到至少一个候选行为序列;确定每一所述候选行为序列与目标特征的相关度;将所述相关度高于第一阈值的候选行为序列作为样本行为序列,训练所述目标特征的预测模型。本申请实施例还同时提供了一种基于超长行为序列的建模装置、终端及存储介质。终端及存储介质。终端及存储介质。

【技术实现步骤摘要】
基于超长行为序列的建模方法及装置、终端、存储介质


[0001]本申请涉及电子设备
,涉及但不限定于基于超长行为序列的建模方法及装置、终端、存储介质。

技术介绍

[0002]传统的变量提取方式大体上可以分为三大类变量,第一是基于历史行为的统计类变量,第二是衍生类变量,概括个体或个体与群体对比的一些比例型变量,第三是用户属性或用户标签类变量,例如收入、职业等。
[0003]基于连续与离散变量开发的LR(logistic regression,逻辑回归)或树模型通常对于抓取具有序列性的行为模式的能力比较欠缺,且强依赖于人为构造的统计特征的准确性。基于短期行为序列的循环神经网络模型,受限于LSTM(Long Short-Term Memory,长短期记忆)或GRU(Gated Recurrent Unit,门控循环单元)模型的记忆长度,通常只能学习到预测前用户在短时间内的连续行为信息,而难以学习到历史上很长一段时间之前的行为模式。

技术实现思路

[0004]本申请实施例提供一种基于超长行为序列的建模方法及装置、终端、存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供一种基于超长行为序列的建模方法,所述方法包括:
[0007]获取目标用户在特定时间段内的超长行为序列;
[0008]根据所述超长行为序列,生成至少两个短期行为序列;
[0009]对所述至少两个短期行为序列进行合并处理,得到至少一个候选行为序列;<br/>[0010]确定每一所述候选行为序列与目标特征的相关度;
[0011]将所述相关度高于第一阈值的候选行为序列作为样本行为序列,训练所述目标特征的预测模型。
[0012]第二方面,本申请实施例提供一种基于超长行为序列的建模装置,包括获取模块、生成模块、合并模块、确定模块和训练模块,其中:
[0013]获取模块,用于获取目标用户在特定时间段内的超长行为序列;
[0014]生成模块,用于根据所述超长行为序列,生成至少两个短期行为序列;
[0015]合并模块,用于对所述至少两个短期行为序列进行合并处理,得到至少一个候选行为序列;
[0016]确定模块,用于确定每一所述候选行为序列与目标特征的相关度;
[0017]训练模块,用于将所述相关度高于第二阈值的候选行为序列作为样本行为序列,训练所述目标特征的预测模型。
[0018]第三方面,本申请实施例提供一种终端,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于超长行为序列
的建模方法中的步骤。
[0019]第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于超长行为序列的建模方法中的步骤。
[0020]本申请实施例提供的技术方案带来的有益效果至少包括:
[0021]在本申请实施例中,首先,对提取的目标用户在特定时间段内的超长行为序列进行切分,得到多个短期行为序列;然后通过池化合并相似度高于一定阈值的短期行为序列;最后再剔除掉与目标特征的相关度极低的一些短期行为序列,得到最终的样本行为序列并进行模型训练;如此,实现了对超长时间序列进行降维处理的同时提取有效信息作为训练样本,来建立规模较小的预测模型,克服了仅使用统计特征建模损失的序列行为模式信息以及仅用短期行为序列建模损失的历史行为模式信息的弊端。
附图说明
[0022]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
[0023]图1为本申请实施例提供的一种基于超长行为序列的建模方法的流程示意图;
[0024]图2为本申请实施例提供的另一种基于超长行为序列的建模方法的流程示意图;
[0025]图3为本申请实施例提供的又一种基于超长行为序列的建模方法的流程示意图;
[0026]图4A为本申请实施例提供的再一种基于超长行为序列的建模方法的流程示意图;
[0027]图4B为本申请实施例提供的训练浅层神经网络模型的过程;
[0028]图5为本申请实施例提供的再一种基于超长行为序列的建模方法的流程示意图;
[0029]图6A为本申请实施例提供的基于超长行为序列构建神经网络模型的逻辑流程图;
[0030]图6B为本申请实施例提供的构建神经网络模型的流程示意图;
[0031]图7为本申请实施例提供的一种基于超长行为序列的建模装置的组成结构示意图;
[0032]图8为本申请实施例提供的一种终端的硬件实体示意图。
具体实施方式
[0033]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。以下实施例用于说明本申请,但不用来限制本申请的范围。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0034]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0035]需要指出,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换
特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0036]本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请实施例所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0037]本申请实施例提供一种基于超长行为序列的建模方法,应用于终端。所述终端包括但不限于手机、笔记本电脑、平板电脑和掌上上网设备、多媒体设备、流媒体设备、移动互联网设备、可穿戴设备或其他类型的终端设备。该方法所实现的功能可以通过终端中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该终端至少包括处理器和存储介质。处理器可以用于进行基于超长行为序列的建模的过程的处理,存储器可以用于存储进行基于超长行为序列的建模的过程中需要的数据以及产生的数据。
[0038]图1为本申请实施例提供的一种基于超长行为序列的建模方法的流程示意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超长行为序列的建模方法,其特征在于,所述方法包括:获取目标用户在特定时间段内的超长行为序列;根据所述超长行为序列,生成至少两个短期行为序列;对所述至少两个短期行为序列进行合并处理,得到至少一个候选行为序列;确定每一所述候选行为序列与目标特征的相关度;将所述相关度高于第一阈值的候选行为序列作为样本行为序列,训练所述目标特征的预测模型。2.如权利要求1所述的方法,其特征在于,所述超长行为序列表征所述目标用户对终端上安装的应用程序的使用记录;所述根据所述超长行为序列,生成至少两个短期行为序列,包括:将所述超长行为序列按照每一所述应用程序的启动时间戳顺序排列;根据每一所述应用程序的启动时间戳和启动时长,确定连续两次使用每一所述应用程序之间的时间间隔;在所述时间间隔大于特定时长的情况下,将排列后的超长行为序列分割成所述至少两个短期行为序列。3.如权利要求1所述的方法,其特征在于,所述对所述至少两个短期行为序列进行合并处理,得到至少一个候选行为序列,包括:确定所述至少两个短期行为序列之间的相似度;在所述相似度大于第二阈值的情况下,利用池化操作对所述至少两个短期行为序列进行合并,得到所述至少一个候选行为序列;其中,每一所述候选行为序列包括合并的所述短期行为序列的个数信息。4.如权利要求3所述的方法,其特征在于,所述确定所述至少两个短期行为序列之间的相似度,包括:确定所述至少两个短期行为序列中时间戳最早的第一短期序列;确定所述第一短期序列中包含的第一应用程序集合与第二短期序列中包含的第二应用程序集合;其中,所述第二短期序列为所述至少两个短期序列中除所述第一短期序列之外的每一短期序列;将所述第一应用程序集合和所述第二应用程序集合之间的交集除以并集的结果,作为所述至少两个短期行为序列之间的相似度。5.如权利要求3所述的方法,其特征在于,所述确定所述至少两个短期行为序列之间的相似度,包括:确定所述至少两个短期行为序列中连续的第三短期序列和第四短期序列;确定将所述第三短期序列转换为所述第四短期序列最小操作数;将所述最小操作数作为所述至少两个短期行为序列之间的相似度。6.如权利要求1至5任一项所述的方法,其特征在于,所述确定每一所述候选行为序列与目标特征的相关度,包括:确定每一所述候选行为序列中每一应用程序类别的类别占比和每一所述应用程序类别的指标分数;对所述指标分数和所述类别占比进行线性求和,得到所述相关度。
7.如权利要求1至5任一项所述的方法,其特征在于,所述确定每一所述候选行为序列与目标特征的相关度,...

【专利技术属性】
技术研发人员:李为
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1