一种用户表征方法和系统技术方案

技术编号:32648007 阅读:21 留言:0更新日期:2022-03-12 18:34
本说明书实施例提供一种用户表征方法和系统,所述方法包括获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;基于所述时间序列,通过特征提取网络得到所述多个时间块的特征表示;基于所述多个时间块的特征表示,通过编码网络得到所述用户的向量表示。码网络得到所述用户的向量表示。码网络得到所述用户的向量表示。

【技术实现步骤摘要】
一种用户表征方法和系统


[0001]本说明书涉及计算机领域,特别涉及一种用户表征方法和系统。

技术介绍

[0002]当前的社会,随着信息技术的发展,越来越多的用户服务都通过互联网等各种网络平台提供给用户,用户在各种平台产生的各种各样的行为在一定程度上反映了用户的习惯和偏好。为了更好地为用户提供个性化以及更贴近用户使用习惯及个人需求的服务,需要对用户的行为数据进行分析以获取用户的特征,而少量场景及短时间的用户数据不足以全面真实地反映用户的行为习惯,需要融合尽量多的场景以及长周期的用户行为数据才能得出用户的综合表征。数据量巨大,对计算能力要求很高,甚至于无法实现,且算法复杂,使得实现难度很大且效果难以保证。
[0003]因此,希望提供一种用户表征方法和系统。

技术实现思路

[0004]本说明书实施例之一提供一种用户表征模型训练方法。所述用户表征模型训练方法包括:获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;通过特征提取网络得到所述多个时间块的特征表示;确定所述多个时间块中的遮罩时间块;基于所述时间序列中除所述遮罩时间块外的其余时间块的特征表示,通过编码网络得到所述遮罩时间块的编码表示以及所述时间序列的整体向量表示;基于当前时间序列的整体向量表示和当前时间序列的前面时间序列或后面时间序列的整体向量表示的相似性,以及所述遮罩时间块的编码表示和所述遮罩时间块对应的特征表示的相似性,调整所述编码网络的参数。
[0005]本说明书实施例之一提供一种用户表征方法。所述用户表征方法包括:获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;基于所述时间序列,通过特征提取网络得到所述多个时间块的特征表示;基于所述多个时间块的特征表示,通过编码网络得到所述用户的向量表示。
[0006]在一些实施例中,所述用户表征方法包括:根据本申请一些实施例所述的用户标准模型训练方法训练用户表征模型,所述用户表征模型包括所述特征提取网络和所述编码网络。
[0007]本说明书实施例之一提供一种用户表征系统,包括获取模块、第一特征提取模块和用户表示模块;所述获取模块用于获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;所述第一特征提取模块用于基于所述时间序列,通过特征提取网络得到所述多个时间块的特征表示;所述用户表示模块用于基于所述多个时间块的特征表示,通过编码网络得到所述用户的向量表示。
[0008]本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行所述用户表征方法。
附图说明
[0009]本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
[0010]图1是根据本说明书一些实施例所示的用户表征系统的应用场景示意图;
[0011]图2是根据本说明书一些实施例所示的用户表征系统的示意图;
[0012]图3是根据本说明书一些实施例所示的用户表征方法的示例性流程图;
[0013]图4是根据本说明书一些实施例所示的用户表征方法的示例性流程图;
[0014]图5是根据本说明书一些实施例所示的用户表征模型训练方法的示例性流程图;
[0015]图6是根据本说明书一些实施例所示的用户表征模型训练方法的示例性流程图;
[0016]图7A、图7B是根据本说明书一些实施例所示的时间块序列化的示意图。
[0017]图8是根据本说明书一些实施例所示的用户表征模型应用的示例性流程图。
具体实施方式
[0018]为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
[0019]应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
[0020]如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
[0021]本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
[0022]图1是根据本说明书一些实施例所示的用户表征系统的应用场景示意图。
[0023]如图1所示,在一些实施例中,系统100可以包括用户终端110、第一计算设备120、第二计算设备130、网络140、存储设备150。
[0024]用户终端110可以提供与用户相关的信息和数据。用户终端110可以包括各种平台,例如,手机客户端、PC客户端、基金、期货、港美股等多个平台的所有用户的终端。在一些实施例中,使用用户终端110的可以是一个或多个用户,可以是直接使用服务的用户,也可以是其他相关用户。在一些实施例中,用户终端110可以是移动设备110

1、平板计算机110

2、膝上型计算机110

3、台式计算机等其他具有输入和/或输出功能的设备中的一种或其任意组合。在一些实施例中,用户终端110可以通过应用程序(例如,客户端等)或网页应用(例
如,微信小程序等)等各种方式,使用服务并产生与用户相关的数据。在一些实施例中,与用户相关的数据可以是包括用户的行为数据在内的各种用户数据。在一些实施例中,用户终端110可以通过网络140和系统100中的其他组件(例如,第一计算设备120、第二计算设备130、存储设备150)传输与用户相关的信息和数据。
[0025]第一计算设备120和第二计算设备130是具有计算和处理能力的系统,可以包括各种计算机,比如服务器、个人计算机,也可以是由多台计算机以各种结构连接组成的计算平台。在一些实施例中,第一计算设备120和第二计算设备130可以在云平台上实现。例如,云平台可以包括私有云、公共云、混合云、社区云、分布式云、跨云、多云等其中一种或几种的组合。在一些实施例中,第一计算设备120与第二计算设备130可以是同一个设备,也可以是不同的设备。
[0026]第一计算设备1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户表征模型训练方法,包括:获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;通过特征提取网络得到所述多个时间块的特征表示;确定所述多个时间块中的遮罩时间块;基于所述时间序列中除所述遮罩时间块外的其余时间块的特征表示,通过编码网络得到所述遮罩时间块的编码表示以及所述时间序列的整体向量表示;基于当前时间序列的整体向量表示和当前时间序列的前面时间序列或后面时间序列的整体向量表示的相似性,以及所述遮罩时间块的编码表示和所述遮罩时间块对应的特征表示的相似性,调整所述编码网络的参数。2.如权利要求1所述的方法,还包括:基于当前时间序列的整体向量表示和当前时间序列的前面时间序列或后面时间序列的整体向量表示的相似性,以及所述遮罩时间块的编码表示和所述遮罩时间块对应的特征表示的相似性,调整所述特征提取网络的参数。3.如权利要求1所述的方法,基于所述时间序列中除所述遮罩时间块外的其余时间块的特征表示,通过编码网络得到所述遮罩时间块的编码表示以及所述时间序列的整体向量表示包括:确定所述多个时间块中的每个时间块的位置表示;基于所述多个时间块中的每个时间块的位置表示和所述其余时间块的特征表示,通过所述编码网络得到所述遮罩时间块的编码表示以及所述时间序列的整体向量表示。4.一种用户表征方法,包括:获取包括多个时间块的时间序列,所述多个时间块中的每个时间块包括用户在一个时段内的行为数据;基于所述时间序列,通过特征提取网络得到所述多个时间块的特征表示;基于所述多个时间块的特征表示,通过编码网络得到所述用户的向量表示...

【专利技术属性】
技术研发人员:赵华洋王路路陶志伟
申请(专利权)人:浙江核新同花顺网络信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1