由计算设备执行的数据处理方法及装置、介质和计算设备制造方法及图纸

技术编号：22169211 阅读：35 留言：0更新日期：2019-09-21 11:35

本发明专利技术提供了一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。该方法包括获取训练样本集，训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，行为序列包括用户操作过的一个或多个对象的标识信息，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；根据每一条训练数据中各个对象的标识信息，获取各个对象中的每个对象的属性信息；基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

Data Processing Methods and Devices, Media and Computing Equipment Executed by Computing Equipment

全部详细技术资料下载

【技术实现步骤摘要】
由计算设备执行的数据处理方法及装置、介质和计算设备
本专利技术的实施方式涉及计算机
，更具体地，本专利技术的实施方式涉及一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着计算机技术的快速发展，丰富了用户获取信息的方式。例如，用户可以利用计算设备中的应用程序了解新闻信息，利用应用程序进行搜索，利用应用程序在网上交易等等。具体地，例如，网上购物已经成为用户的主流购物方式，电商网站则会提供智能贴心的功能改善用户购物体验。但是，在实现本专利技术的过程中，专利技术人发现，采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。
技术实现思路
因此，在现有技术中，采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户，这是非常令人烦恼的过程。为此，非常需要一种改进的数据处理方法及装置、介质和计算设备，以使得能够较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。在本上下文中，本专利技术的实施方式期望提供一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。在本专利技术实施方式的第一方面中，提供了一种由计算设备执行的数据处理方法，包括：获取训练样本集，其中，上述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的...

【技术保护点】
1.一种由计算设备执行的数据处理方法，包括：获取训练样本集，其中，所述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻，所述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息；根据所述每一条训练数据中各个对象的标识信息，获取所述各个对象中的每个对象的属性信息；以及基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。

【技术特征摘要】
1.一种由计算设备执行的数据处理方法，包括：获取训练样本集，其中，所述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻，所述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息；根据所述每一条训练数据中各个对象的标识信息，获取所述各个对象中的每个对象的属性信息；以及基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。2.根据权利要求1所述的方法，其中，所述向量生成模型具有损失函数，所述损失函数包括：其中，表示将所述每一条训练数据中的中心对象的标识信息和属性信息进行向量初始化得到的第一初始向量；表示将所述每一条训练数据中的上下文对象的标识信息和属性信息进行向量初始化得到的第二初始向量；表示将所述每一条训练数据中的目标操作针对的对象的标识信息和属性信息进行向量初始化得到的第三初始向量；rii表示将所述第一初始向量和所述第三初始向量进行矩阵相乘后，得到的结果矩阵的对角线上的元素；rij表示所述结果矩阵中除所述对角线上的元素之外的其他元素；b表示所述向量生成模型并行处理的训练数据的条数；n表示所述上下文对象的个数，α为权重系数。3.根据权利要求1所述的方法，还包括：获取目标用户的目标行为序列；确定所述目标行为序列所涉及的多个第一交互对象；以及根据与所述多个第一交互对象中的每个第一交互对象对应的第一交互对象向量和所述目标行为序列来构建所述目标用户的用户向量，其中，所述目标用户的用户向量用于表征所述目标用户感兴趣的一个或多个关联对象。4.根据权利要求3所述的方法，其中，所述构建所述目标用户的用户向量包括：根据所述目标行为序列确定针对所述多个第一交互对象中的每个第一交互对象的权重；以及根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量。5.根据权利要求4所述的方法，其中，根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量包括：...

【专利技术属性】
技术研发人员：张俊，潘胜一，杨杰，罗晓华，
申请(专利权)人：杭州网易再顾科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人