一种基于多视角数据和循环网络构建序列预测模型的方法技术

技术编号:15228075 阅读:101 留言:0更新日期:2017-04-27 12:19
本发明专利技术公开了一种基于多视角数据和循环网络的序列预测方法,其包括:获取多个用户在不同时刻购买的多个物品的数据,并对数据进行预处理;对所述预处理后的数据进行组合获取物品表达,将各用户物品表达按购买时间排序,形成用户序列;将当前用户序列送到循环网络模型的输入端进行训练;所述循环网络的处理端建立当前用户的表达,输出端计算当前用户对物品的偏好值;更新所述循环网络模型参数;将下一用户序列送到循环网络的输入端进行训练,直至所有用户序列都训练一次称为一次迭代;每次迭代更新全部偏好值的和,迭代多次,直至偏好值的和达到极大值或极小值,迭代结束。

【技术实现步骤摘要】

本专利技术涉及数据挖掘
,尤其是一种基于多视角数据和循环网络构建序列预测模型的方法。
技术介绍
现实中基于互联网的网络购物越来越流行,用户在不同时间的购物行为可看作一条购买序列,准确预测该序列之后的值也即用户以后的购买,将极大地提高用户体验并且刺激网络购物平台发展。在购物过程中,物品的多视角数据信息比如图片、文本描述等,会起到不容忽视的作用。因此选用合适的模型建模用户购买序列和这些提供极大信息的多视角数据,将会降低预测的不确定性,提高学习性能,有效缓解推荐冷启动问题。传统的方法一般分为两类:(1)基于矩阵分解,模型虽能融合多视角数据,但忽略了物品出现的次序;(2)基于马尔科夫链,模型虽能处理序列,但该模型基于概率,多视角数据在这种模型中起不到多少作用。因此传统方法并不能适用于多视角数据的序列预测情境,需要新的技术方法。
技术实现思路
(一)要解决的技术问题鉴于现有方法不能有效地满足序列预测任务,本专利技术提出了一种基于多视角数据和循环网络构建序列预测模型的方法。该方法采用多视角数据建立物品多方面表达,通过循环网络进行建模,进而获得用户序列同样的多方面表达。(二)技术方案本专利技术是通过以下技术方案实现的:一种基于多视角数据和循环网络构建序列预测模型的方法,包括步骤:S1:获取多个用户在不同时刻购买的多个物品的数据,并对所述数据进行预处理;S2:对所述预处理后的数据进行组合获取物品表达,将各用户的物品表达按购买时间排序形成用户序列;S3:将当前用户序列送到循环网络模型的输入端进行训练;S4:所述循环网络模型的处理端建立当前用户的序列表达,输出端计算当前用户对物品的偏好值;S5:更新所述循环网络模型参数;S6:将下一用户序列送到循环网络模型的输入端进行训练,重新返回步骤S3开始执行,直至所有用户序列都经过训练称为一次迭代,每次迭代后进行循环网络模型预测;S7:判断每次迭代后循环网络模型目标函数的值是否达到极大值或极小值,若是,则迭代结束,否则重新返回步骤S3开始执行,进行下一次迭代,直至目标函数的值达到极大值或极小值。上述方案中,所述步骤S1包括:获取合适的数据集;获取物品图像特征并对物品图像特征进行归一化;获取物品文本特征,并将物品文本特征归一化到与物品图像特征相同的数值范围;建立物品隐含特征,并将物品隐含特征归一化到与物品文本特征相同的数值范围。上述方案中,所述步骤S2包括:选取降维维度;对预处理后的数据进行降维,形成物品表达;将各用户的物品表达按购买时间由远及近排序,形成用户序列。上述方案中,所述对预处理后的数据进行降维包括:对物品图像特征、物品文本特征进行降维,物品隐含特征与降维后的物品图像特征、物品文本特征拼接成物品表达。上述方案中,在所述步骤S4中,用户的序列表达由各时刻循环网络模型的隐层值来表示,当前时刻的隐层值由当前时刻的物品表达、前一时刻的隐层值、转移矩阵代入神经网络激活函数得到。上述方案中,在所述步骤S4中,当前时刻的偏好值由当前时刻的正样本物品表达、负样本物品表达、循环网络模型前一时刻的隐层值得到。上述方案中,所述步骤S5包括:建立目标函数;前传参数更新;回传参数更新。上述方案中,所述步骤S6包括:将下一用户序列送入循环网络模型进行训练,并将该用户所有偏好值的和累加到目标函数中,每次迭代后目标函数的值为全部用户所有偏好值的总和;依次选取评价指标和对比方法,进行结果对比,完成循环网络模型预测。上述方案中,采用卷积神经网络提取物品图像特征,采用最小-最大规范化对物品图像特征归一化;和/或,基于词之间共生关系的GloVe模型提取物品文本特征,采用最小-最大规范化对物品文本特征归一化。上述方案中,所述神经网络激活函数为包括Sigmoid、tanh或ReLU。(三)有益效果本专利技术的基于多视角数据和循环网络构建序列预测模型方法,(1)从物品中提取出的多视角数据,即物品图像特征、物品文本特征和物品隐含特征,建立物品表达,能更加全面准备的反应物品特征;(2)建立物品表达后采用循环网络模型,该模型不仅能建模当前输入信息,还能保留有之前的序列信息,即既能反应当前用户兴趣也能建模用户长期兴趣,提高了序列预测模型的准确性。附图说明图1为本专利技术实施例的基于多视角数据和循环网络构建序列预测模型的方法流程图。图2是本专利技术实施例的基于多视角数据和循环网络构建序列预测模型的方法的模型流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。本专利技术适用于互联网购物平台的用户购买序列预测,实例数据均为用户真实购买行为,图1为为本专利技术实施例的方法流程图,图2为本专利技术模型流程图,结合图2对本专利技术方法做进一步说明。步骤S1:获取多个用户在不同时刻购买的多个物品的数据,并对所述数据进行预处理。分为以下几个子步骤:子步骤S1.1,获取合适的数据集,数据集包括多个用户在不同时刻购买的多个物品。本实例中采用阿里巴巴天池平台的竞赛数据集Taobao_Clothes_Matching(本专利技术中简称TaoBao),选取其中的物品图文数据、用户历史行为数据,挑选出购买行为不少于30次的用户的物品进行实验,数据集中的物品指服装。数据集基本情况如表1所示。表1数据集用户数目物品数目总购买次数TaoBao376902827591873429多视角数据包括物品图像特征、物品文本特征和物品隐含特征,步骤S1还包括:子步骤S1.2,获取物品图像特征并对物品图像特征进行归一化。从数据集中提取出的多视角数据特征一定要进行归一化才可以用于建模,归一化包括最小-最大规范化、零-均值规范化等。归一化后的物品图像特征可表示为v。采用已经预训练好的卷积神经网络GoogLeNet提取1024维的物品图像特征,然后采用最小-最大规范化将物品图像特征值缩放到范围[0,0.5],原1024维的各物品图像特征值均不小于零。子步骤S1.3,获取物品文本特征,并将物品文本特征进行归一化到与物品图像特征相同的数值范围。归一化后物品文本特征可表示为s。采用基于词之间共生关系的GloVe模型提取100维的物品文本特征,然后采用最小-最大规范化将物品文本特征值缩放到范围[-0.5,0.5],原100维的各物品文本特征值位于零两侧。子步骤S1.4,建立物品隐含特征,并将物品隐含特征归一化到与物品文本特征相同的数值范围。归一化后的不可直接观测的物品隐含特征可表示为x。直接定义变量,另其均匀分布于范围[-0.5,0.5],作为物品隐含特征。物品图像特征、物品文本特征是物品可直接观测的,不因用户购买而发生改变。而这里直接用变量表示的物品隐含特征是不可直接观测得到的,是从大量纯粹的用户购买序列中逐渐学习出来的,表示用户对物品购买意愿等无法直接表示的信息。步骤S2:对所述预处理后的数据进行组合获取物品表达,将各用户的物品表达按购买时间排序形成用户序列。分为以下几个子步骤:子步骤S2.1:选取合适的降维维度。由于所提取的多视角数据通常维度较高,因此需要降维后再送入模型,本实例中选取降维维度(30,1),维度过高则计算复杂,维度过低则表达能力不足。子步骤S2.2:获取物品组合表达。与变换矩阵相乘的方法进行降维简单易行而且不会丢失特本文档来自技高网...

【技术保护点】
一种基于多视角数据和循环网络构建序列预测模型的方法,包括步骤:S1:获取多个用户在不同时刻购买的多个物品的数据,并对所述数据进行预处理;S2:对所述预处理后的数据进行组合获取物品表达,将各用户的物品表达按购买时间排序形成用户序列;S3:将当前用户序列送到循环网络模型的输入端进行训练;S4:所述循环网络模型的处理端建立当前用户的序列表达,输出端计算当前用户对物品的偏好值;S5:更新所述循环网络模型参数;S6:将下一用户序列送到循环网络模型的输入端进行训练,重新返回步骤S3开始执行,直至所有用户序列都经过训练称为一次迭代,每次迭代后进行循环网络模型预测;S7:判断每次迭代后循环网络模型目标函数的值是否达到极大值或极小值,若是,则迭代结束,否则重新返回步骤S3开始执行,进行下一次迭代,直至目标函数的值达到极大值或极小值。

【技术特征摘要】
1.一种基于多视角数据和循环网络构建序列预测模型的方法,包括步骤:S1:获取多个用户在不同时刻购买的多个物品的数据,并对所述数据进行预处理;S2:对所述预处理后的数据进行组合获取物品表达,将各用户的物品表达按购买时间排序形成用户序列;S3:将当前用户序列送到循环网络模型的输入端进行训练;S4:所述循环网络模型的处理端建立当前用户的序列表达,输出端计算当前用户对物品的偏好值;S5:更新所述循环网络模型参数;S6:将下一用户序列送到循环网络模型的输入端进行训练,重新返回步骤S3开始执行,直至所有用户序列都经过训练称为一次迭代,每次迭代后进行循环网络模型预测;S7:判断每次迭代后循环网络模型目标函数的值是否达到极大值或极小值,若是,则迭代结束,否则重新返回步骤S3开始执行,进行下一次迭代,直至目标函数的值达到极大值或极小值。2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:获取合适的数据集;获取物品图像特征并对物品图像特征进行归一化;获取物品文本特征,并将物品文本特征归一化到与物品图像特征相同的数值范围;建立物品隐含特征,并将物品隐含特征归一化到与物品文本特征相同的数值范围。3.根据权利要求1所述的方法,其特征在于,所述步骤S2包括:选取降维维度;对预处理后的数据进行降维,形成物品表达;将各用户的物品表达按购买时间由远及近排序,形成用户序列。4.根据权利要求3所述的方...

【专利技术属性】
技术研发人员:王亮吴书崔强刘强
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1