一种特征提取的方法、装置、设备以及存储介质制造方法及图纸

技术编号:35744061 阅读:25 留言:0更新日期:2022-11-26 18:48
本公开提供了一种特征提取的方法、装置、设备以及存储介质,涉及计算机数据处理技术领域,尤其涉及人工智能技术领域。具体实现方案为:根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。如此提取到的行为习惯特征可更为准确地表征用户的行为习惯,有助于提高数据的表达能力,进而提升后续模型处理的精度和准确度。提升后续模型处理的精度和准确度。提升后续模型处理的精度和准确度。

【技术实现步骤摘要】
一种特征提取的方法、装置、设备以及存储介质


[0001]本公开涉及计算机数据处理
,尤其涉及人工智能


技术介绍

[0002]在构建模型之前,通常需要对拟输入模型的数据进行预处理,以获取干净、整齐和准确的数据。之后,再基于预处理后的数据进行模型特征构建,并结合业务场景所产生的衍生变量来提升数据表达能力,进而提升模型效果。

技术实现思路

[0003]本公开提供了一种特征提取的方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种特征提取的方法,包括:根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。
[0005]根据本公开的另一方面,提供了一种特征提取的装置,包括:行为序列获取模块,用于根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;行为习惯特征提取模块,用于根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。
[0006]根据本公开的另一方面,提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述特征提取的方法。
[0007]根据本公开的另一方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述特征提取的方法。
[0008]根据本公开的另一方面,提供一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述特征提取的方法。
[0009]本公开提供了一种特征提取的方法、装置、设备以及存储介质。该方法通过从用户的行为序列中,提取行为之间的关系信息和/或模式信息来提取每一用户的行为习惯特征,如此提取到的行为习惯特征可更为准确地表征用户的行为习惯,有助于提高数据的表达能力,进而提升后续模型处理的精度和准确度。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1本公开第一实施例实现特征提取的方法的示意图;
[0013]图2本公开第二实施例获取用户行为习惯的过程示意图;
[0014]图3本公开第三实施例根据行为序列,提取用户行为习惯特征的所采用的系统架
构示意图;
[0015]图4本公开第四实施例根据行为序列,提取用户行为习惯特征的所采用的系统架构示意图;
[0016]图5本公开第五实施例根据行为序列,提取用户行为习惯特征的所采用的系统架构示意图;
[0017]图6本公开第六实施例因果判断模型的模型特征和设定结果的因果关系推断图;
[0018]图7本公开实施例特征提取的装置的结构示意图;
[0019]图8是用来实现本公开实施例的特征提取的方法的电子设备的框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]图1示出了本公开一实施例实现特征提取的方法的流程图。如图1所示,该方法包括:
[0022]操作S110,根据用户行为数据,获取每一用户的行为序列,行为序列包括按时序排列的至少一个行为;
[0023]其中,用户行为数据包括用户的行为以及行为所发生的时间,可以来自记录用户操作的日志文件,也可以来自用户所使用的客户端与服务器之间的通信记录等。
[0024]用户的行为包括用户执行的操作、操作的对象及操作的结果等。最简单的情况下,用户的行为可仅包括用户所执行的操作,或仅包括操作的对象。
[0025]在获取每一用户的行为序列时,可先获取每一用户对应的用户行为数据,从每一用户对应的用户行为数据中获取每一用户的行为以及行为所发生的时间,然后按照行为所发生的时间,对用户的行为进行排序,便可形成每一用户的行为序列。
[0026]例如,从如下所示的日志文件:
[0027]【用户1】【2022年1月1日下午5点10分】【浏览】【商品x1】;
[0028]【用户1】【2022年1月1日下午5点15分】【浏览】【商品x2】;
[0029]【用户2】【2022年1月1日下午5点20分】【浏览】【商品x3】;
[0030]【用户1】【2022年1月1日下午5点25分】【加入购物车】【商品x2】;
[0031]【用户2】【2022年1月1日下午5点20分】【浏览】【商品x1】;
[0032]【用户1】【2022年1月1日下午5点30分】【购买】【商品x2】;
[0033]【用户2】【2022年1月1日下午5点35分】【购买】【商品x1】;
[0034]可得到:
[0035]用户1的行为序列{“【浏览】【商品x1】”,“【浏览】【商品x3】”,“【加入购物车】【商品x2】”,“【购买】【商品x2】”};
[0036]用户2的行为序列{“【浏览】【商品x3】”,“【浏览】【商品x1】”,“【购买】【商品x1】”}。
[0037]一个人执行一系列行为的顺序,往往取决于行为之间的内在联系(例如,承接关系和因果关系等)或个人的行为习惯。具有时序性的行为序列,恰恰可以通过行为之间的排列
顺序,保留了行为之间的内在联系或个人的行为习惯等潜在信息。
[0038]因此,通过用户的行为序列,可进一步挖掘出行为之间的内在联系和用户的行为模式,而如果某一行为模式反复出现,则可以推测出该行为模式已经成为用户的一种行为习惯。
[0039]例如,如果用户的行为序列中,在“浏览”和“购买”的行为之间,总有“加入购物车”的行为,则可以推测出用户具有“浏览后先加购物车再购买产品”的消费习惯;如果用户的行为序列中,“购买”的行为之前只有“浏览”行为,很少有“加入购物车”的行为,则可以推测出该用户具有“浏览完毕后直接购买产品”的消费习惯。
[0040]由此可见,比起离散的行为数据,行为序列更容易发现用户行为习惯的蛛丝马迹,也更容易从中提取到用户的行为习惯特征。
[0041]操作S120,根据行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。
[0042]其中,提取行为之间的关系信息,指提取行为序列中可以代表用户行为之间内在关系的信息。
[0043]提取行为之间的模式信息,指提取行为序列中可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征提取的方法,包括:根据用户行为数据,获取每一用户的行为序列,所述行为序列包括按时序排列的至少一个行为;根据所述行为序列,提取行为之间的关系信息和/或模式信息,得到每一用户的行为习惯特征。2.根据权利要求1所述的方法,其中,所述用户行为数据包括会话信息,相应地,所述根据用户行为数据,获取每一用户的行为序列,包括:根据用户行为数据,获取每一用户在每一会话中的行为序列。3.根据权利要求1所述的方法,其中,根据所述行为序列,提取行为之间的关系信息,得到每一用户的行为习惯特征,包括:对所述行为序列进行关联规则挖掘,得到所述至少一个行为之间的关联规则;将所述关联规则确定为每一用户的行为习惯特征。4.根据权利要求1所述的方法,其中,对所述行为序列进行关联规则挖掘,得到所述至少一个行为之间的关联规则,包括:将所述行为序列中的每个行为及行为之间的组合作为项,根据设定的第一最小支持度,从所述行为序列中,发现频繁项集;根据所述频繁项集和设定的最小置信度,确定所述至少一个行为之间的强关联规则。5.根据权利要求1所述的方法,其中,所述根据所述行为序列,提取行为之间的模式信息,得到每一用户的行为习惯特征,包括:对所述行为序列进行序列模式的挖掘,得到所述行为序列的序列模式;将所述序列模式确定为每一用户的行为习惯特征。6.根据权利要求5所述的方法,其中,所述对所述行为序列进行序列模式的挖掘,得到所述行为序列的序列模式,包括:根据设定的第二最小支持度,从所述行为序列中确定支持度大于或等于所述第二最小支持度的频繁子序列;将所述频繁子序列确定所述行为序列的序列模式。7.根据权利要求1所述的方法,其中,提取行为之间的关系信息和模式信息,得到每一用户的行为习惯特征,包括:根据所述行为序列,进行关联规则的挖掘,得到所述至少一个行为之间的关联规则;根据所述行为序列,进行序列模式的挖掘,得到所述行为序列的序列模式;对所述关联规则和所述序列模式进行融合,得到每一用户的行为习惯特征。8.根据权利要求1所述的方法,还包括:将所述行为习惯特征输入应用模型,得到输出结果,所述应用模型的模型特征包括所述行为习惯特征。9.根据权利要求1所述的方法,其中,所述将所述行为习惯特征输入应用模型,得到输出结果,包括:将所述行为习惯特征输入因果关系推断模型,得到所述行为习惯特征与指定结果之间的因果关系。10.一种特征提取的装置,包括:
行为序列获取模块,用于根据用户行为数据,获取每一用户的行为序列,所述行为序列包括按时序排列的至少一个行为;行为习惯特征确定模块,用于根据所述行为序列,提取行为之间的关系信息和/或模式信息,得到每...

【专利技术属性】
技术研发人员:朱喜玲王凯刘明珠孙伟龙封树超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1