由计算设备执行的数据处理方法及装置、介质和计算设备制造方法及图纸

技术编号:22169211 阅读:35 留言:0更新日期:2019-09-21 11:35
本发明专利技术提供了一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。该方法包括获取训练样本集,训练样本集包括多条训练数据,每一条训练数据至少包括以下对象的标识信息:中心对象、上下文对象和目标操作针对的对象;上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻,行为序列包括用户操作过的一个或多个对象的标识信息,在行为序列中按照对象被操作的时间顺序排列对象的标识信息;根据每一条训练数据中各个对象的标识信息,获取各个对象中的每个对象的属性信息;基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型,以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

Data Processing Methods and Devices, Media and Computing Equipment Executed by Computing Equipment

【技术实现步骤摘要】
由计算设备执行的数据处理方法及装置、介质和计算设备
本专利技术的实施方式涉及计算机
,更具体地,本专利技术的实施方式涉及一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着计算机技术的快速发展,丰富了用户获取信息的方式。例如,用户可以利用计算设备中的应用程序了解新闻信息,利用应用程序进行搜索,利用应用程序在网上交易等等。具体地,例如,网上购物已经成为用户的主流购物方式,电商网站则会提供智能贴心的功能改善用户购物体验。但是,在实现本专利技术的过程中,专利技术人发现,采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。
技术实现思路
因此,在现有技术中,采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户,这是非常令人烦恼的过程。为此,非常需要一种改进的数据处理方法及装置、介质和计算设备,以使得能够较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。在本上下文中,本专利技术的实施方式期望提供一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。在本专利技术实施方式的第一方面中,提供了一种由计算设备执行的数据处理方法,包括:获取训练样本集,其中,上述训练样本集包括多条训练数据,每一条训练数据至少包括以下对象的标识信息:中心对象、上下文对象和目标操作针对的对象;上述上下文对象的标识信息与上述中心对象的标识信息在同一个行为序列中的排列位置相邻,上述行为序列包括用户操作过的一个或多个对象的标识信息,其中,在上述行为序列中按照对象被操作的时间顺序排列上述对象的标识信息。在本专利技术实施方式的第二方面中,提供了一种由计算设备执行的数据处理装置,包括:第一获取模块,用于获取训练样本集,其中,上述训练样本集包括多条训练数据,每一条训练数据至少包括以下对象的标识信息:中心对象、上下文对象和目标操作针对的对象;上述上下文对象的标识信息与上述中心对象的标识信息在同一个行为序列中的排列位置相邻,上述行为序列包括用户操作过的一个或多个对象的标识信息,其中,在上述行为序列中按照对象被操作的时间顺序排列上述对象的标识信息;第二获取模块,用于根据上述每一条训练数据中各个对象的标识信息,获取上述各个对象中的每个对象的属性信息;以及训练模块,用于基于上述各个对象中的每个对象的标识信息和属性信息训练向量生成模型,以使得训练后的上述向量生成模型能够用于输出表征对象的对象向量。在本专利技术实施方式的第三方面中,提供了一种介质,存储有计算机可执行指令,上述指令在被处理单元执行时用于实现如上所述的方法。在本专利技术实施方式的第四方面中,提供了一种计算设备,包括:处理单元;以及存储单元,存储有计算机可执行指令,上述指令在被上述处理单元执行时用于实现如上所述的方法。根据本专利技术实施方式的由计算设备执行的数据处理方法及装置、介质和计算设备,通过获取训练样本集,其中,每一条训练数据包括中心对象、上下文对象和目标操作针对的对象的标识信息,上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻,在行为序列中按照对象被操作的时间顺序排列对象的标识信息;基于每个对象的标识信息和属性信息训练向量生成模型,训练后的向量生成模型能够用于输出表征对象的对象向量,可以通过大数据、机器学习和深度学习等技术,基于数据和算法的配合,输出对象的对象向量,以便刻画用户兴趣和感知用户意图,可以缩短用户的需求表达路径,降低用户中断购买流程的概率,为用户带来了更好的体验。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1示意性地示出了根据本专利技术实施方式的数据处理方法及其装置的应用场景示意图;图2示意性地示出了根据本专利技术实施例的由计算设备执行的数据处理方法的流程图;图3示意性示出了根据本专利技术实施例的融合属性信息的向量表征模型结构的示意图;图4示意性示出了根据本专利技术另一实施例的数据处理方法的流程图;图5示意性示出了根据本专利技术实施例的构建目标用户的用户向量的流程图;图6示意性示出了根据本专利技术实施例的构建目标用户的检索词向量的流程图;图7示意性示出了根据本专利技术实施例的实时推荐目标对象的流程图;图8示意性示出了根据本专利技术另一实施例的实时推荐目标对象的流程图;图9示意性示出了根据本专利技术另一实施例的个性化推荐目标对象的流程图;图10示意性地示出了根据本专利技术实施例的由计算设备执行的数据处理装置的框图;图11示意性地示出了根据本专利技术实施方式的用于实现数据处理方法的程序产品示意图;以及图12示意性地示出了根据本专利技术实施例的用于实现数据处理方法的计算设备的框图。在附图中,相同或对应的标号表示相同或对应的部分。具体实施方式下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。根据本专利技术的实施方式,提出了一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。在本文中,需要理解的是,所涉及的术语含义如下。行为序列:基于时间顺序对用户和商品产生的各种交互行为进行排序(交互行为包括但不限于例如商品详情页浏览、商品加入购物车、商品查看评论、商品分享等等)。嵌入模型(EmbeddingModel):是指将高维空间嵌入到一个维数低得多的连续向量空间中的模型。搜索底纹:用于呈现在搜索框中的默认搜索词,以引导触发用户进行搜索。搜索发现:用于呈现个性化的一批搜索词,供用户选择使用。向量表征:指将一个对象(例如可以为用户、商品、检索词)表示为多维空间的向量。搜索意图:指用户潜意识想搜索的检索词或者商品,可能没有通过查询行为序列表达出来。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。下面参考本专利技术的若干代表性实施方式,详细阐释本专利技术的原理和精神。专利技术概述本专利技术人发现,随着计算机技术的快速发展,丰富了用户获取信息的方式。例如,用户可以利用计算设备中的应用程序了解新闻信息,利用应用程序进行搜索,利用应用程序在网上交易等等。具体地,例如,网上购物已经成为用户的主流购物方式,电商网站则会提供智能贴心的功能改善用户购物体验。在用户的整个购物流程中,搜索是较为频繁使用的功能,其能表达用户的购买需求。在相关技术中,由于每个人对相同商品的书面表述都不同,用户输入检索词寻找商品,使用过程中可能会多次调整检索词以定位目标商品,因此,在基于用户搜索意图多维本文档来自技高网...

【技术保护点】
1.一种由计算设备执行的数据处理方法,包括:获取训练样本集,其中,所述训练样本集包括多条训练数据,每一条训练数据至少包括以下对象的标识信息:中心对象、上下文对象和目标操作针对的对象;所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻,所述行为序列包括用户操作过的一个或多个对象的标识信息,其中,在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息;根据所述每一条训练数据中各个对象的标识信息,获取所述各个对象中的每个对象的属性信息;以及基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型,以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。

【技术特征摘要】
1.一种由计算设备执行的数据处理方法,包括:获取训练样本集,其中,所述训练样本集包括多条训练数据,每一条训练数据至少包括以下对象的标识信息:中心对象、上下文对象和目标操作针对的对象;所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻,所述行为序列包括用户操作过的一个或多个对象的标识信息,其中,在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息;根据所述每一条训练数据中各个对象的标识信息,获取所述各个对象中的每个对象的属性信息;以及基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型,以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。2.根据权利要求1所述的方法,其中,所述向量生成模型具有损失函数,所述损失函数包括:其中,表示将所述每一条训练数据中的中心对象的标识信息和属性信息进行向量初始化得到的第一初始向量;表示将所述每一条训练数据中的上下文对象的标识信息和属性信息进行向量初始化得到的第二初始向量;表示将所述每一条训练数据中的目标操作针对的对象的标识信息和属性信息进行向量初始化得到的第三初始向量;rii表示将所述第一初始向量和所述第三初始向量进行矩阵相乘后,得到的结果矩阵的对角线上的元素;rij表示所述结果矩阵中除所述对角线上的元素之外的其他元素;b表示所述向量生成模型并行处理的训练数据的条数;n表示所述上下文对象的个数,α为权重系数。3.根据权利要求1所述的方法,还包括:获取目标用户的目标行为序列;确定所述目标行为序列所涉及的多个第一交互对象;以及根据与所述多个第一交互对象中的每个第一交互对象对应的第一交互对象向量和所述目标行为序列来构建所述目标用户的用户向量,其中,所述目标用户的用户向量用于表征所述目标用户感兴趣的一个或多个关联对象。4.根据权利要求3所述的方法,其中,所述构建所述目标用户的用户向量包括:根据所述目标行为序列确定针对所述多个第一交互对象中的每个第一交互对象的权重;以及根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量。5.根据权利要求4所述的方法,其中,根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量包括:...

【专利技术属性】
技术研发人员:张俊潘胜一杨杰罗晓华
申请(专利权)人:杭州网易再顾科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1