【技术实现步骤摘要】
行为序列数据处理方法、装置、电子设备及存储介质
本公开涉及人工智能
,尤其涉及一种行为序列数据处理方法、装置、电子设备及存储介质。
技术介绍
在许多场景下,需要对用户行为序列进行分析和处理。用户行为序列,是用户在日常操作使用中产生的一系列点击、访问、购买等事件的发生过程,它蕴含了用户的细粒度兴趣偏好等特点,是用户级别机器学习模型的重要特征来源之一。相关技术中,往往直接将包括很长一段时间内的用户大量历史行为记录的行为序列,作为学习用户兴趣偏好的历史数据,但行为序列本身包含了大量不同历史时间的历史行为记录,无法有效表征用户当前的兴趣偏好,造成推荐系统中推荐精准性和效果差的问题。
技术实现思路
本公开提供一种行为序列数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中行为序列无法有效表征用户当前的兴趣偏好,造成推荐系统中推荐精准性和效果差的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种行为序列数据处理方法,包括:获取目标对象的历史行为序列,所述历史行为序列 ...
【技术保护点】
1.一种行为序列数据处理方法,其特征在于,包括:/n获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;/n确定每个历史行为记录中的行为时间与当前时间的时间差;/n基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;/n基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。/n
【技术特征摘要】
1.一种行为序列数据处理方法,其特征在于,包括:
获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;
确定每个历史行为记录中的行为时间与当前时间的时间差;
基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;
基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。
2.根据权利要求1所述的行为序列数据处理方法,其特征在于,所述方法还包括:
获取所述目标对象的当前行为数据,所述当前行为数据表征所述目标对象对所述当前时间推荐给所述目标对象的推荐信息的行为数据;
所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征。
3.根据权利要求2所述的行为序列数据处理方法,其特征在于,所述基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征包括:
将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
对所述目标行为序列和所述当前行为数据进行特征提取,得到所述目标行为序列对应的初始行为序列特征和所述当前行为数据对应的行为特征信息;
对所述初始行为序列特征和所述行为特征信息进行注意力学习,得到所述目标行为序列特征。
4.根据权利要求1所述的行为序列数据处理方法,其特征在于,所述基于所述时间差,生成每个所述历史行为记录对应的位置编码信包括:
对所述时间差进行对数变换,得到目标时间差;
对所述目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
对所述多个类别对应的第一时间差群组进行独热编码,得到所述位置编码信息;
或,
基于所述时间差的数值大小对所述时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个所述历史行为记录对应的时间差所对应类别的时间差区间范围与每个所述历史行为记录对应的时间差成反比...
【专利技术属性】
技术研发人员:牛亚男,宋洋,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。