一种基于多视角数据和循环网络构建序列预测模型的方法技术

技术编号：15228075 阅读：101 留言：0更新日期：2017-04-27 12:19

本发明专利技术公开了一种基于多视角数据和循环网络的序列预测方法，其包括：获取多个用户在不同时刻购买的多个物品的数据，并对数据进行预处理；对所述预处理后的数据进行组合获取物品表达，将各用户物品表达按购买时间排序，形成用户序列；将当前用户序列送到循环网络模型的输入端进行训练；所述循环网络的处理端建立当前用户的表达，输出端计算当前用户对物品的偏好值；更新所述循环网络模型参数；将下一用户序列送到循环网络的输入端进行训练，直至所有用户序列都训练一次称为一次迭代；每次迭代更新全部偏好值的和，迭代多次，直至偏好值的和达到极大值或极小值，迭代结束。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据挖掘
，尤其是一种基于多视角数据和循环网络构建序列预测模型的方法。
技术介绍
现实中基于互联网的网络购物越来越流行，用户在不同时间的购物行为可看作一条购买序列，准确预测该序列之后的值也即用户以后的购买，将极大地提高用户体验并且刺激网络购物平台发展。在购物过程中，物品的多视角数据信息比如图片、文本描述等，会起到不容忽视的作用。因此选用合适的模型建模用户购买序列和这些提供极大信息的多视角数据，将会降低预测的不确定性，提高学习性能，有效缓解推荐冷启动问题。传统的方法一般分为两类：(1)基于矩阵分解，模型虽能融合多视角数据，但忽略了物品出现的次序；(2)基于马尔科夫链，模型虽能处理序列，但该模型基于概率，多视角数据在这种模型中起不到多少作用。因此传统方法并不能适用于多视角数据的序列预测情境，需要新的技术方法。
技术实现思路
(一)要解决的技术问题鉴于现有方法不能有效地满足序列预测任务，本专利技术提出了一种基于多视角数据和循环网络构建序列预测模型的方法。该方法采用多视角数据建立物品多方面表达，通过循环网络进行建模，进而获得用户序列同样的多方面表达。(二)技术方案本专利技术是通过以下技术方案实现的：一种基于多视角数据和循环网络构建序列预测模型的方法，包括步骤：S1：获取多个用户在不同时刻购买的多个物品的数据，并对所述数据进行预处理；S2：对所述预处理后的数据进行组合获取物品表达，将各用户的物品表达按购买时间排序形成用户序列；S3：将当前用户序列送到循环网络模型的输入端进行训练；S4：所述循环网络模型的处理端建立当前用户的序列表达，输出端计算当前用...

【技术保护点】
一种基于多视角数据和循环网络构建序列预测模型的方法，包括步骤：S1：获取多个用户在不同时刻购买的多个物品的数据，并对所述数据进行预处理；S2：对所述预处理后的数据进行组合获取物品表达，将各用户的物品表达按购买时间排序形成用户序列；S3：将当前用户序列送到循环网络模型的输入端进行训练；S4：所述循环网络模型的处理端建立当前用户的序列表达，输出端计算当前用户对物品的偏好值；S5：更新所述循环网络模型参数；S6：将下一用户序列送到循环网络模型的输入端进行训练，重新返回步骤S3开始执行，直至所有用户序列都经过训练称为一次迭代，每次迭代后进行循环网络模型预测；S7：判断每次迭代后循环网络模型目标函数的值是否达到极大值或极小值，若是，则迭代结束，否则重新返回步骤S3开始执行，进行下一次迭代，直至目标函数的值达到极大值或极小值。

【技术特征摘要】
1.一种基于多视角数据和循环网络构建序列预测模型的方法，包括步骤：S1：获取多个用户在不同时刻购买的多个物品的数据，并对所述数据进行预处理；S2：对所述预处理后的数据进行组合获取物品表达，将各用户的物品表达按购买时间排序形成用户序列；S3：将当前用户序列送到循环网络模型的输入端进行训练；S4：所述循环网络模型的处理端建立当前用户的序列表达，输出端计算当前用户对物品的偏好值；S5：更新所述循环网络模型参数；S6：将下一用户序列送到循环网络模型的输入端进行训练，重新返回步骤S3开始执行，直至所有用户序列都经过训练称为一次迭代，每次迭代后进行循环网络模型预测；S7：判断每次迭代后循环网络模型目标函数的值是否达到极大值或极小值，若是，则迭代结束，否则重新返回步骤S3开始执行，进行下一次迭代，直至目标函数的值达到极大值或极小值。2.根据权利要求1所述的方法，其特征在于，所述步骤S1包括：获取合适的数据集；获取物品图像特征并对物品图像特征进行归一化；获取物品文本特征，并将物品文本特征归一化到与物品图像特征相同的数值范围；建立物品隐含特征，并将物品隐含特征归一化到与物品文本特征相同的数值范围。3.根据权利要求1所述的方法，其特征在于，所述步骤S2包括：选取降维维度；对预处理后的数据进行降维，形成物品表达；将各用户的物品表达按购买时间由远及近排序，形成用户序列。4.根据权利要求3所述的方...

【专利技术属性】
技术研发人员：王亮，吴书，崔强，刘强，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人