一种数据处理方法、装置及服务器制造方法及图纸

技术编号:20363372 阅读:13 留言:0更新日期:2019-02-16 16:45
本发明专利技术公开了一种数据处理方法、装置及服务器,所述方法包括:获取目标用户的历史行为对象,利用所述历史行为对象确定所述目标用户的用户行为特征向量;获取多个待选择对象的行为用户,利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量;将所述用户行为特征向量和每一待选择对象的对象行为特征向量输入行为识别模型进行行为识别处理,得到所述目标用户对待选择对象的行为概率;基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象。利用本发明专利技术提供的技术方案可以提高对用户的行为对象的识别准确率。

【技术实现步骤摘要】
一种数据处理方法、装置及服务器
本专利技术涉及互联网通信
,尤其涉及一种数据处理方法、装置及服务器。
技术介绍
互联网和计算机技术随着社会发展越来越普及。人们通过互联网获取各种信息,以满足不同的需求。在一些情况下,用户会使用电子设备浏览文字信息、观看视频信息。一些互联网网站为了增加用户的浏览观看率,往往需要向用户推荐信息,以便用户对该信息进行浏览、观看等行为操作,相应的,需要从网站中选取一定的信息作为用户的推荐信息。
技术实现思路
本专利技术提供了一种数据处理方法、装置及服务器,可以提高对用户的行为对象的识别准确率。第一方面,本专利技术提供了一种数据处理方法,所述方法包括:获取目标用户的历史行为对象,利用所述历史行为对象确定所述目标用户的用户行为特征向量;获取多个待选择对象的行为用户,利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量;将所述用户行为特征向量和每一待选择对象的对象行为特征向量输入行为识别模型进行行为识别处理,得到所述目标用户对待选择对象的行为概率;基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象;其中,所述行为识别模型包括基于用户行为特征向量、用户无行为特征向量和对象行为特征向量进行行为识别训练得到的预测模型。第二方面提供了一种数据处理装置,所述装置包括:历史行为对象获取模块,用于获取目标用户的历史行为对象;用户行为特征向量确定模块,用于利用所述历史行为对象确定所述目标用户的用户行为特征向量;行为用户确定模块,用于获取多个待选择对象的行为用户;对象行为特征向量确定模块,用于利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量;行为识别处理模块,用于将所述用户行为特征向量和每一待选择对象的对象行为特征向量输入行为识别模型进行行为识别处理,得到所述目标用户对待选择对象的行为概率;目标行为对象确定模块,用于基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象;其中,所述行为识别模型包括基于用户行为特征向量、用户无行为特征向量和对象行为特征向量进行行为识别训练得到的预测模型。第三方面提供了一种数据处理服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的数据处理方法。第四方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的数据处理方法。本专利技术提供的数据处理方法、装置及服务器,具有如下技术效果:本专利技术能够提高对用户的行为对象的识别准确率,保证后续推荐给用户的对象更符合用户需求,有效改善用户体验,进而增加用户对服务系统中对象的行为操作。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本专利技术实施例提供的一种应用环境的示意图;图2是本专利技术实施例提供的一种行为识别模型的训练的示意图;图3是本专利技术实施例提供的一种利用每一样本用户的历史行为对象确定所述样本用户的用户行为特征向量方法的流程示意图;图4是本专利技术实施例提供的另一种利用每一样本用户的历史行为对象确定所述样本用户的用户行为特征向量方法的流程示意图;图5是本专利技术实施例提供的行为识别模型训练及应用过程的一种示意图;图6是本专利技术实施例提供的一种数据处理方法的流程示意图;图7是本专利技术实施例提供的一种数据处理装置的结构示意图;图8是本专利技术实施例提供的一种服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。请参阅图1,图1是本专利技术提供的应用环境的一种实施例示意图,如图1所示,该应用环境可以包括客户端01和服务器02。具体的,本说明书实施例中,所述客户端01并不仅限于图1中的智能手机,在实际应用中,还可以包括台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如快手、抖音、微博等提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,本说明书实施例中,所述服务器02可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器02可以包括有网络通信单元、处理器和存储器等等。具体的,所述服务器02可以为上述服务商所对应的后台服务器。在实际应用中,用户可以在客户端01对服务器02推送的信息进行一种或多种行为操作,相应的,当用户对某一信息进行了相应的行为操作之后,客户端可以将该行为操作相关的信息发送给服务器进行存储,具体的,行为操作相关的信息可以包括行为操作的对象、所述对象的行为用户,以及行为发生的时间等信息。本说明书实施例中,对象可以包括服务系统(服务器02和客户端01组成的系统)中提供给用户可以进行某一种或多种行为操作的信息,例如文字、图片、视频等信息。具体的,所述对象的行为用户可以包括对对象进行了一种或多种行为操作的用户。具体的,用户对对象的行为操作可以包括但不限于对该对象的浏览、观看、点赞、关注、转发、评论等行为操作。进一步的,服务器02可以根据历史行为操作相关的信息进行行为识别处理的训练,以便后续可以识别出用户对服务系统中的对象的行为概率。以下介绍本专利技术提供的行为识别模型的训练实施例,具体的,如图2所示,可以包括:S201:获取多个样本用户的历史行为对象和预设数量的无行为对象。本说明书实施例中,所述样本用户可以包括对服务器系统提供的信息(对象)进行过一种或多种行为的用户。相应的,样本用户的历史行为对象可以包括服务系统中已经被样本用户进行了某一种或多种行为操作的对象。所述无行为对象可以包括服务系统中未被样本用户进行行为操作的对象,一般的,为了保证后续行为识别处理训练过程中正样本数据和负样本数据的平衡,本说明书实施例中,所述无行为对象的数量(预设数量)可以根据用户所对应的历史行为对象的数量确定,具体的,某一用户的无行为对象的数量可本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标用户的历史行为对象,利用所述历史行为对象确定所述目标用户的用户行为特征向量;获取多个待选择对象的行为用户,利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量;将所述用户行为特征向量和每一待选择对象的对象行为特征向量输入行为识别模型进行行为识别处理,得到所述目标用户对待选择对象的行为概率;基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象;其中,所述行为识别模型包括基于用户行为特征向量、用户无行为特征向量和对象行为特征向量进行行为识别训练得到的预测模型。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标用户的历史行为对象,利用所述历史行为对象确定所述目标用户的用户行为特征向量;获取多个待选择对象的行为用户,利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量;将所述用户行为特征向量和每一待选择对象的对象行为特征向量输入行为识别模型进行行为识别处理,得到所述目标用户对待选择对象的行为概率;基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象;其中,所述行为识别模型包括基于用户行为特征向量、用户无行为特征向量和对象行为特征向量进行行为识别训练得到的预测模型。2.根据权利要求1所述的方法,其特征在于,所述行为识别模型具体包括采用下述方式确定:获取多个样本用户的历史行为对象和预设数量的无行为对象;利用每一样本用户的历史行为对象确定所述样本用户的用户行为特征向量,以及利用所述样本用户的无行为对象确定所述样本用户的用户无行为特征向量;获取每一样本用户的历史行为对象的行为用户和所述预设数量的无行为对象的行为用户;利用每一样本用户的历史行为对象的行为用户确定所述历史行为对象的对象行为特征向量,以及利用每一样本用户的无行为对象的行为用户确定所述无行为对象的对象无行为特征向量;将每一样本用户的用户行为特征向量和历史行为对象的对象行为特征向量进行横向拼接处理,得到正样本数据;将每一样本用户的用户无行为特征向量和无行为对象的对象无行为特征向量进行横向拼接处理,得到负样本数据;基于所述正样本数据和负样本数据进行行为识别训练,得到行为识别模型。3.根据权利要求1所述的方法,其特征在于,所述利用所述历史行为对象确定所述目标用户的用户行为特征向量包括:利用所述历史行为对象的标识信息组成第一长度的矩阵,所述第一长度的矩阵包括所述历史行为对象的标识信息;将所述第一长度的矩阵展开为多维的矩阵,所述多维的矩阵的维度与所述待选择对象的数量相同;对所述多维的矩阵进行稀疏线性嵌入降维处理,得到降维处理后的矩阵;将所述降维处理后的矩阵进行平均处理,得到所述目标用户的用户行为特征向量。4.根据权利要求1所述的方法,其特征在于,当所述历史行为对象所对应的行为包括多种行为时,所述利用所述历史行为对象确定所述目标用户的用户行为特征向量包括:利用每一种行为所对应的历史行为对象的标识信息组成所述行为所对应的第二长度的矩阵,所述第二长度的矩阵包括所述行为所对应的待选择对象的标识信息;将每一第二长度的矩阵展开为多维的矩阵,所述多维的矩阵的维度与所述待选择对象的数量相同;对每一多维的矩阵进行稀疏线性嵌入降维处理,得到降维处理后的矩阵;将每一降维处理后的矩阵进行平均处理,得到平均处理后的特征向量;将多个平均处理后的特征向量进行横向拼接处理,得到所述目标用户的用户行为特征向量。5.根据权利要求1所述的方法,其特征在于,所述利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量包括:利用每一待选择对象的行为用户的标识信息组成第三长度的矩阵,所述第三长度的矩阵包括所述行为用户的标识信息;将所述第三长度的矩阵展开为多维的矩阵,所述多维的矩阵的维度与所述目标用户的数量相同;对所述多维的矩阵进行稀疏线性嵌入降维处理,得到降维处理后的矩阵;将所述降维处理后的矩阵进行平均处理,得到所述待选择对象的对象行为特征向量。6.根据权利要求1所述的方法,其特征在于,当对待选择对象的行为包括多种行为时,所述利用每一待选择对象的行为用户确定所述待选择对象的对象行为特征向量包括:利用对待选择对象的每一种行为所对应的行为用户的标识信息组成所述行为所对应的第四长度的矩阵,所述第四长度的矩阵包括所述行为用户的标识信息;将每一第四长度的矩阵展开为多维的矩阵,所述多维的矩阵的维度与所述目标用户的数量相同;对每一多维的矩阵进行稀疏线性嵌入降维处理,得到降维处理后的矩阵;将每一降维处理后的矩阵进行平均处理,得到平均处理后的特征向量;将多个平均处理后的特征向量进行横向拼接处理,得到待选择对象的对象行为特征向量。7.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户对待选择对象的行为概率从所述多个待选择对象中确定所述目标用户的目标行为对象包括:将最大的行为概率所对应的待选择对象作为所述目标用户的目标行为对象;或,将行为概率大于等于第一阈值的待选择对象作为所述目标用户的目标行为对象。8.根据权利要求1...

【专利技术属性】
技术研发人员:刘龙坡
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1