基于特征增强的推荐系统神经网络训练方法及装置制造方法及图纸

技术编号：24888979 阅读：55 留言：0更新日期：2020-07-14 18:16

本公开涉及一种基于特征增强的推荐系统神经网络训练方法及装置，所述方法包括：将第一训练集中的多个第一样本，输入第t轮待训练的神经网络中进行处理，得到与多个第一样本对应的预测分值；根据多个第一样本的特征信息及与多个第一样本对应的预测分值，分别确定神经网络对各个属性的关注度；根据关注度阈值及神经网络对各个属性的关注度，分别确定各个属性的增强概率；根据第一增强率及增强概率，从多个第一样本的特征信息中，确定出待更新的特征信息；根据待更新的特征信息及噪声特征值，更新第一训练集中的第一样本，得到更新后的第二训练集；根据第二训练集，对神经网络进行第t轮训练。本公开的实施例可提高神经网络的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于特征增强的推荐系统神经网络训练方法及装置
本公开涉及机器学习领域，尤其涉及一种基于特征增强的推荐系统神经网络训练方法及装置。
技术介绍
深度学习是机器学习的一种，主要利用深度神经网络对数据进行分析建模，以发掘输入特征和预测目标之间的规律。深度学习在计算机视觉、计算语言学、信息检索等多个领域取得了显著效果。深度神经网络的设计通常注重网络架构、特征表示等，在训练过程中，深度神经网络容易过拟合，导致过度依赖某几项特征而忽略了其他特征。例如，通过深度神经网络对人的肥胖程度进行预测时，如果将性别、年龄、体重、身高、三围、肩宽等特征作为输入，不加约束地长时间训练后，深度神经网络很可能过拟合，只关注性别、体重这两个特征，而对其他相对间接的特征的利用不足。而且，在深度神经网络的使用过程中，有些特征可能有噪声，例如体重可能是不准确的，深度神经网络过度依赖这些有噪声的特征会使得预测结果的准确性较差。
技术实现思路
有鉴于此，本公开提出了一种基于特征增强的推荐系统神经网络训练方法及装置。根据本公开的一方面，...

【技术保护点】
1.一种基于特征增强的推荐系统神经网络训练方法，其特征在于，所述方法包括：/n将预设的第一训练集中的多个第一样本，输入第t轮待训练的神经网络中进行处理，得到与所述多个第一样本对应的预测分值，t为正整数，所述第一样本包括表示用户属性的特征信息及表示待推荐对象的对象属性的特征信息；/n根据所述多个第一样本的特征信息及与所述多个第一样本对应的预测分值，分别确定所述神经网络对各个属性的关注度；/n根据预设的关注度阈值及所述神经网络对各个属性的关注度，分别确定所述各个属性的增强概率；/n根据预设的所述多个第一样本的特征信息的第一增强率及所述各个属性的增强概率，从所述多个第一样本的特征信息中，确定出待更新...

【技术特征摘要】
1.一种基于特征增强的推荐系统神经网络训练方法，其特征在于，所述方法包括：
将预设的第一训练集中的多个第一样本，输入第t轮待训练的神经网络中进行处理，得到与所述多个第一样本对应的预测分值，t为正整数，所述第一样本包括表示用户属性的特征信息及表示待推荐对象的对象属性的特征信息；
根据所述多个第一样本的特征信息及与所述多个第一样本对应的预测分值，分别确定所述神经网络对各个属性的关注度；
根据预设的关注度阈值及所述神经网络对各个属性的关注度，分别确定所述各个属性的增强概率；
根据预设的所述多个第一样本的特征信息的第一增强率及所述各个属性的增强概率，从所述多个第一样本的特征信息中，确定出待更新的特征信息；
根据所述待更新的特征信息及预设的噪声特征值，更新所述第一训练集中的第一样本，得到更新后的第二训练集；
根据所述第二训练集，对所述神经网络进行第t轮训练，
其中，所述神经网络应用于推荐系统，用于预测用户对所述推荐系统中的待推荐对象的评分。

2.根据权利要求1所述的方法，其特征在于，根据所述多个第一样本的特征信息及与所述多个第一样本对应的预测分值，分别确定所述神经网络对各个属性的关注度，包括：
对于第一训练集中的任一第一样本，根据所述第一样本的特征信息及与所述第一样本对应的预测分值，分别确定所述第一样本的各个特征信息对所述预测分值的第一贡献值；
对于多个属性中的任一属性，从各个第一样本的各个特征信息的第一贡献值中，确定出与所述属性对应的特征信息的第二贡献值；
将所述第二贡献值的平均值，确定为所述神经网络对所述属性的关注度。

3.根据权利要求1所述的方法，其特征在于，根据预设的所述多个第一样本的特征信息的第一增强率及所述各个属性的增强概率，从所述多个第一样本的特征信息中，确定出待更新的特征信息，包括：
根据预设的所述多个第一样本的特征信息的第一增强率，确定所述多个第一样本的特征信息的增强数量；
从所述第一训练集的多个第一样本中，随机选取多个第二样本，所述第二样本的数量与所述增强数量相同；
对于任一第二样本，根据所述各个属性的增强概率，从多个属性中，随机选取一个属性，并将所述第二样本中与随机选取的属性对应的特征信息，确定为待更新的特征信息。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
根据预设的初始增强率、预设的最大增强率及预设的每轮增强率变化值，确定第t轮训练时所述多个第一样本的特征信息的第二增强率；
根据所述最大增强率及所述第二增强率，确定第t轮训练时所述多个第一样本的特征信息的第一增强率。

5.根据权利要求1所述的方法，其特征在于，根据预设的关注度阈值及所述神经网络对各个属性的关注度，分别确定所述各个属性的增强概率，包括：
对于任一属性，在所述神经网络对所述属性的关注度小于预设的关注度阈值的情况下，将所述关注度确定为所述属性的增强概率。

6.根据权利要求5所述的方法，其特征在于，根据预设的关注度阈值及所述神经网络对各个属性的关注度，分别确定所述各个属性的增强概率，还包括...

【专利技术属性】
技术研发人员：施韶韵，张敏，郝斌，李大任，张瑞，于新星，单厚智，刘奕群，马少平，
申请(专利权)人：清华大学，智者四海北京技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人