【技术实现步骤摘要】
一种特征提取的方法、装置、设备以及存储介质
[0001]本公开涉及计算机数据处理
,尤其涉及人工智能
技术介绍
[0002]在构建模型之前,通常需要对拟输入模型的数据进行预处理,以获取干净、整齐和准确的数据。之后,再基于预处理后的数据进行模型特征构建,并结合业务场景所产生的衍生变量来提升数据表达能力,进而提升模型效果。
技术实现思路
[0003]本公开提供了一种特征提取的方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种特征提取的方法,包括:根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。
[0005]根据本公开的另一方面,提供了一种特征提取的装置,包括:行为序列获取模块,用于根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;行为习惯特征提取模块,用于根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。
[0006]根据本公开的另一方面,提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述特征提取的方法。
[0007]根据本公开的另一方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述特征提取的 ...
【技术保护点】
【技术特征摘要】
1.一种特征提取的方法,包括:根据用户行为数据,获取每一用户的行为序列,所述行为序列包括按时序排列的至少一个行为;根据所述行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。2.根据权利要求1所述的方法,其中,所述用户行为数据包括会话信息,相应地,所述根据用户行为数据,获取每一用户的行为序列,包括:根据用户行为数据,获取每一用户在每一会话中的行为序列。3.根据权利要求1所述的方法,其中,根据所述行为序列,提取行为之间的关系信息,得到每一用户的行为习惯特征,包括:对所述行为序列进行关联规则挖掘,得到所述至少一个行为之间的关联规则;将所述关联规则确定为每一用户的行为习惯特征。4.根据权利要求1所述的方法,其中,对所述行为序列进行关联规则挖掘,得到所述至少一个行为之间的关联规则,包括:将所述行为序列中的每个行为及行为之间的组合作为项,根据设定的第一最小支持度,从所述行为序列中,发现频繁项集;根据所述频繁项集和设定的最小置信度,确定所述至少一个行为之间的强关联规则。5.根据权利要求1所述的方法,其中,所述根据所述行为序列,提取行为之间的模式信息,得到每一用户的行为习惯特征,包括:对所述行为序列进行序列模式的挖掘,得到所述行为序列的序列模式;将所述序列模式确定为每一用户的行为习惯特征。6.根据权利要求5所述的方法,其中,所述对所述行为序列进行序列模式的挖掘,得到所述行为序列的序列模式,包括:根据设定的第二最小支持度,从所述行为序列中确定支持度大于或等于所述第二最小支持度的频繁子序列;将所述频繁子序列确定所述行为序列的序列模式。7.根据权利要求1所述的方法,其中,提取行为之间的关系信息和模式信息,得到每一用户的行为习惯特征,包括:根据所述行为序列,进行关联规则的挖掘,得到所述至少一个行为之间的关联规则;根据所述行为序列,进行序列模式的挖掘,得到所述行为序列的序列模式;对所述关联规则和所述序列模式进行融合,得到每一用户的行为习惯特征。8.根据权利要求1所述的方法,还包括:将所述行为习惯特征输入应用模型,得到输出结果,所述应用模型的模型特征包括所述行为习惯特征。9.根据权利要求1所述的方法,其中,所述将所述行为习惯特征输入应用模型,得到输出结果,包括:将所述行为习惯特征输入因果关系推断模型,得到所述行为习惯特征与指定结果之间的因果关系。10.一种特征提取的装置,包括:
行为序列获取模块,用于根据用户行为数据,获取每一用户的行为序列,所述行为序列包括按时序排列的至少一个行为;行为习惯特征确定模块,用于根据所述行为序列,提取行为之间的关系信息和/或模式信息,得到每...
【专利技术属性】
技术研发人员:朱喜玲,王凯,刘明珠,孙伟龙,封树超,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。