神经网络模型训练、对象推荐方法及装置制造方法及图纸

技术编号:19178912 阅读:32 留言:0更新日期:2018-10-17 00:39
本申请涉及计算机技术领域,尤其涉及一种神经网络模型训练、对象推荐方法及装置,在一种神经网络模型训练方法中,对预先收集的多个样本数据中的每个样本数据,确定样本数据对应的one‑hot形式的特征向量;根据各个样本数据对应的one‑hot形式的特征向量以及各个样本数据的样本标签,训练LR模型;根据训练出的LR模型,确定N个数据值对应的N个权重值;对每个样本数据,从N个权重值中选取样本数据对应的one‑hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M

Neural network model training, object recommendation method and device

This application relates to the field of computer technology, in particular to a neural network model training, object recommendation method and device. In a neural network model training method, a feature vector of one_hot form corresponding to the sample data is determined for each sample data collected in advance from a plurality of sample data. According to the trained LR model, the N weights corresponding to the N data values are determined; for each sample data, the data value 1 corresponding to the one hot eigenvector of the sample data is selected from the N weights corresponding to the one hot eigenvector of the sample data. The weight of the target is obtained, and the weights of M targets are obtained, M

【技术实现步骤摘要】
神经网络模型训练、对象推荐方法及装置
本申请涉及计算机
,尤其涉及一种神经网络模型训练、对象推荐方法及装置。
技术介绍
传统技术中,在搜集到样本数据之后,直接根据样本数据以及样本数据的样本标签,来训练神经网络模型。然而,上述搜集的样本数据通常会包括多个维度的信息,这会导致神经网络模型训练的效率比较低,且训练的神经网络模型比较复杂。由于神经网络模型比较复杂,当被应用上线时,其向用户推荐目标对象的耗时就会比较长,也即其时效性比较差,这会导致该神经网络模型不能被应用到时效性要求比较高的场景中。
技术实现思路
本申请描述了一种神经网络模型训练、对象推荐方法及装置,可以提高神经网络模型训练的效率。第一方面,提供了一种神经网络模型训练方法,包括:对预先收集的多个样本数据中的每个样本数据,确定所述样本数据对应的one-hot形式的特征向量,所述样本数据包括样本标签,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;根据各个样本数据对应的one-hot形式的特征向量以及所述各个样本数据的样本标签,训练逻辑回归LR模型;根据训练出的LR模型,确定所述N个数据值对应的N个权重值;对每个样本数据,从N个权重值中选取所述样本数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M<N;将各个样本数据的M个目标权重值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练。第二方面,提供了一种对象推荐方法,包括:获取用户的目标行为数据;根据所述目标行为数据,确定one-hot形式的特征向量,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;从N个数据值对应的N个权重值中选取所述目标行为数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值;所述N个权重值是根据逻辑回归LR模型确定的,M<N;将所述M个目标权重值输入到神经网络模型中,以确定所述用户感兴趣的目标对象;向所述用户推荐所述目标对象。第三方面,提供了一种神经网络模型训练装置,包括:确定单元,用于对预先收集的多个样本数据中的每个样本数据,确定所述样本数据对应的one-hot形式的特征向量,所述样本数据包括样本标签,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;训练单元,用于根据所述确定单元确定的各个样本数据对应的one-hot形式的特征向量以及所述各个样本数据的样本标签,训练逻辑回归LR模型;所述确定单元,还用于根据所述训练单元训练出的LR模型,确定所述N个数据值对应的N个权重值;选取单元,用于对每个样本数据,从所述确定单元确定的N个权重值中选取所述样本数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M<N;输入单元,用于将所述选取单元选取的各个样本数据的M个目标权重值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练。第四方面,提供了一种对象推荐装置,包括:获取单元,用于获取用户的目标行为数据;确定单元,用于根据所述获取单元获取的所述目标行为数据,确定one-hot形式的特征向量,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;选取单元,用于从N个数据值对应的N个权重值中选取所述目标行为数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值;所述N个权重值是根据逻辑回归LR模型确定的,M<N;输入单元,用于将所述选取单元选取的所述M个目标权重值输入到神经网络模型中,以确定所述用户感兴趣的目标对象;推荐单元,用于向所述用户推荐所述目标对象。本申请提供的神经网络模型训练、对象推荐方法及装置,对预先收集的多个样本数据中的每个样本数据,确定样本数据对应的one-hot形式的特征向量;根据各个样本数据对应的one-hot形式的特征向量以及各个样本数据的样本标签,训练LR模型;根据训练出的LR模型,确定N个数据值对应的N个权重值;对每个样本数据,从N个权重值中选取样本数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M<N;将各个样本数据的M个目标权重值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练。由此,可以提高神经网络模型训练的效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请一种实施例提供的神经网络模型训练方法流程图;图2为本申请提供的LR模型的示意图;图3为本申请提供的训练DNN的过程示意图之一;图4为本申请提供的训练DNN的过程示意图之二;图5为本申请一种实施例提供的对象推荐方法流程图;图6为本申请一种实施例提供的神经网络模型训练装置示意图;图7为本申请一种实施例提供的对象推荐装置示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。本申请实施例提供的神经网络模型训练方法适用于对深度神经网络(DeepNeuralNetwork,DNN)或者人工神经网络(ArtificialNeuralNetwork,ANN)等神经网络模型进行训练的场景。训练好的神经网络模型可以用于向用户推荐目标对象的场景,如,可以用于向用户推荐目标商品、目标广告或者目标服务等。图1为本申请一种实施例提供的神经网络模型训练方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图1所示,所述方法具体包括:步骤110,对预先收集的多个样本数据中的每个样本数据,确定该样本数据对应的one-hot形式的特征向量。上述多个样本数据可以被划分为两种类型:正样本数据和负样本数据。以神经网络模型用于向用户推荐目标商品为例来说,上述正样本数据可以是指用户对商品的点击行为数据。上述负样本数据可以是指用户对商品的无点击行为数据。举例来说,某网站的网页页面中同时展现了商品A和商品B,用户×在浏览该网站时,点击了商品A,而未点击商品B。则可以将用户×点击商品A的行为数据划分为正样本数据,而将用户×未点击商品B的行为数据划分为负样本数据。对上述样本数据,该样本数据可以包括样本标签。在一个例子中,该样本标签可以包括:正样本标签和负样本标签,其中,正样本标签用于标注正样本数据,负样本标签用于标注负样本数据。在一种实现方式中,样本数据集合中的负样本数据可以占绝大多数的比重。在一种实现方式中,步骤110中确定每个样本数据对应的one-hot形式的特征向量的过程可以为:对每个样本数据,首先确定目标类型的特征对应的原始特征值,此处的目标类型可以包括:连续类型和/或离散类型。之后再根据目标类型的特征对应的原始特征值,确定one-hot形式的特征向量,该one-hot形式的特征向量可以包括N个数据值,该数据值可以包括数据值0和数据值1。需要说明的是,上述目标类型的特征可以从如下三方面的信息中提取:1)用户的基本信息。2)对象的基本信息。3)用户的基本信息与对象的基本信息的交叉信息。以神经本文档来自技高网...

【技术保护点】
1.一种神经网络模型训练方法,其特征在于,包括:对预先收集的多个样本数据中的每个样本数据,确定所述样本数据对应的one‑hot形式的特征向量,所述样本数据包括样本标签,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;根据各个样本数据对应的one‑hot形式的特征向量以及所述各个样本数据的样本标签,训练逻辑回归LR模型;根据训练出的LR模型,确定所述N个数据值对应的N个权重值;对每个样本数据,从N个权重值中选取所述样本数据对应的one‑hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M

【技术特征摘要】
1.一种神经网络模型训练方法,其特征在于,包括:对预先收集的多个样本数据中的每个样本数据,确定所述样本数据对应的one-hot形式的特征向量,所述样本数据包括样本标签,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;根据各个样本数据对应的one-hot形式的特征向量以及所述各个样本数据的样本标签,训练逻辑回归LR模型;根据训练出的LR模型,确定所述N个数据值对应的N个权重值;对每个样本数据,从N个权重值中选取所述样本数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值,M<N;将各个样本数据的M个目标权重值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练。2.根据权利要求1所述的方法,其特征在于,所述对预先收集的多个样本数据中的每个样本数据,确定所述样本数据对应的one-hot形式的特征向量,包括:对预先收集的多个样本数据中的每个样本数据,确定目标类型的特征对应的原始特征值,所述目标类型包括:连续类型和离散类型;根据所述目标类型的特征对应的原始特征值,确定one-hot形式的特征向量;所述将各个样本数据的M个目标权重值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练,包括:将各个样本数据的M个目标权重值以及连续类型的特征对应的原始特征值作为各个样本数据的新的特征值,输入神经网络模型对其进行训练。3.根据权利要求2所述的方法,其特征在于,还包括:预先为所述目标类型的特征设定多个取值;所述对预先收集的多个样本数据中的每个样本数据,确定目标类型的特征对应的原始特征值,包括:根据所述样本数据,从所述目标类型的特征的多个预设的取值中选取一个取值;将所述一个取值确定为所述目标类型的特征对应的原始特征值。4.根据权利要求3所述的方法,其特征在于,所述目标类型的特征的个数为多个;M是根据所述特征的个数确定的;N是根据各个特征的取值的个数总和确定的。5.根据权利要求2-4任一项所述的方法,其特征在于,所述目标类型的特征包括:用户的基本信息、对象的基本信息以及用户的基本信息与对象的基本信息的交叉信息。6.一种对象推荐方法,其特征在于,包括:获取用户的目标行为数据;根据所述目标行为数据,确定one-hot形式的特征向量,所述特征向量包括N个数据值,所述数据值包括数据值0和数据值1;从N个数据值对应的N个权重值中选取所述目标行为数据对应的one-hot形式的特征向量中数据值1对应的目标权重值,得到M个目标权重值;所述N个权重值是根据逻辑回归LR模型确定的,M<N;将所述M个目标权重值输入到神经网络模型中,以确定所述用户感兴趣的目标对象;向所述用户推荐所述目标对象。7.根据权利要求6所述的方法,其特征在于,所述根据所述目标行为数据,确定one-hot形式的特征向量,包括:根据所述目标行为数据,确定目标类型的特征对应的原始特征值,所述目标类型包括:连续类型和离散类型;根据所述目标类型的特征对应的原始特征值,确定one-hot形式的特征向量;所述将所述M个目标权重值输入到神经网络模型中,以确定所述用户感兴趣的目标对象,包括:将所述M个目标权重值以及所述连续类型的特征对应的原始特征值输入到神经网络模型中,以确定所述用户感兴趣的目标对象。8.根据权利要求7所述的方法,其特征在于,还包括:预先为所述目标类型的特征设定多个取值;所述根据所述目标行为数据,确定目标类型的特征对应的原始特征值,包括:根据所述目标行为数据,从所述目标类型的特征的多个预设的取值中选取一个取值;将所述一个取值确定为所述目标类型的特征对应的原始特征值。9.根据权利要求8所述的方法,其特征在于,所述目标类型的特征的个数为多个;M是根据所述特征的个数确定的;N是根据各个特征的取值的个数总和确定的。10.根据权利要求7-9任一项所述的方法,其特征在于,所述目标类型的特征包括:用户的基本信息、对象的基本信息以及用户的基本信息与对象的基本信息的交叉信息。11.一种神经网络模型训...

【专利技术属性】
技术研发人员:赵沛霖李龙飞周俊李小龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1