基于对抗网络的商品推荐方法、电子装置及存储介质制造方法及图纸

技术编号:20655711 阅读:13 留言:0更新日期:2019-03-23 07:16
本发明专利技术涉及大数据分析,提供基于对抗网络的商品推荐方法、电子装置及存储介质,包括:获得用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;根据行为数据生成随机输入向量;将随机输入向量和行为数据输入对抗网络模型,所述对抗网络模型包括生成器和判别器,所述随机输入向量输入生成器得到随机生成向量,所述随机生成向量作为判别器的虚拟输入,所述行为数据作为判别器的真实输入;所述判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,判断判别器是否收敛,当判别器不收敛时,驱动生成器更新直至判别器收敛,将所述生成器的随机生成向量作为推荐序列。所述方法、装置及介质准确学习推荐实体的特征。

Commodity Recommendation Method, Electronic Device and Storage Medium Based on Countermeasure Network

The invention relates to large data analysis, providing commodity recommendation methods, electronic devices and storage media based on adversarial network, including: obtaining user's behavior data for commodities, the behavior data includes purchase data and browsing data; generating random input vectors according to behavior data; inputting random input vectors and behavior data into adversarial network model, and the adversarial network model package. Including generator and discriminator, the random input vector input generator obtains the random generated vector, the random generated vector acts as the virtual input of the discriminator, and the behavior data acts as the real input of the discriminator; the discriminator judges the real input and the virtual input, the output judges the ratio of the real and the virtual, and judges whether the discriminator converges or not, when the discriminator does not receive. When convergence occurs, the driver generator updates until the discriminator converges, and the random generated vector of the generator is used as the recommended sequence. The method, device and medium accurately learn the characteristics of the recommended entity.

【技术实现步骤摘要】
基于对抗网络的商品推荐方法、电子装置及存储介质
本专利技术涉及商品推荐
,更为具体地,涉及一种基于对抗网络的商品推荐方法、电子装置及存储介质。
技术介绍
随着网络技术的发展,用户越来越多的通过网络、APP等浏览和购买商品,为了方便用户购买商品,可以向用户推荐其可能喜欢的商品。现阶段单领域推荐系统主要是采用传统的贝叶斯先验/协同过滤算法或是CNN/RNN/DBN等深度学习网络模型实现,虽然这些深度学习模型对于低层的特征提,推荐的准确性有待提高。
技术实现思路
鉴于上述问题,本专利技术的目的是提供一种准确学习推荐实体的特征的基于生成对抗网络的推荐方法、电子装置及计算机可读存储介质。为了实现上述目的,本专利技术提供一种电子装置,包括存储器和处理器,所述存储器中包括基于对抗网络的商品推荐程序,所述处理器执行所述基于对抗网络的商品推荐程序,所述基于对抗网络的商品推荐程序包括:采集部,采集用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;随机输入向量生成部,根据行为数据生成随机输入向量;对抗网络模型生成部,包括生成器、判别器、更新模块和推荐模块,所述随机输入向量生成部生成的随机输入向量作为所述生成器的输入,得到的随机生成向量作为所述判别器的虚拟输入,采集部采集的行为数据作为判别器的真实输入,通过判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,当判别器不收敛时,更新模块发送信号给生成器,驱动生成器更新,将判别器收敛时所述生成器的输出作为推荐模块的推荐序列。优选地,所述对抗网络模型生成部还包括第一损失模型构建模块,构建判别器的损失模型,通过所述损失模型判断判别器是否收敛。优选地,所述生成器采用LSTM模型,包括输入层、隐含层和输出层,输入层设置有输入门、输出层设置有输出门和遗忘门,还包括:神经网络构建模块,根据下式(1)-(4)构建输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型,Si=f(a(S)xi+b(S))(1)Hj=f(a(H)Si+b(H))(2)C=f(a(C)Hj+b(C))(3)Y=f(a(Y)Hj+b(Y))(4)其中,xi为输入层第i个节点的输入,Si为xi在输入门的输入,Hj为xi在隐含层第j个节点的输出,C为xi在输出门的输出,Y为xi在遗忘门的输出,a(S),a(H),a(C),a(Y),b(S),b(H),b(C),b(Y)皆为待训练的权值参数,S,H,C,Y分别表示权值属于输入门、隐含层、输出门和遗忘门;初始化模块,对神经网络的权值参数进行初始赋值;训练集和测试集分割模块,对不同用户在设定时间对商品行为数据依次分为第一时间段行为数据和第二时间段行为数据,将第一时间段行为数据作为训练集,第二时间段行为数据作为输出门测试集,将不包括第二时间段行为数据中商品类的随机输入向量作为遗忘门测试集;训练模块,通过训练集、输出门测试集和遗忘门测试集训练输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型。优选地,所述基于对抗网络的商品推荐程序还包括:数据库,对商品进行聚类编码;向量转化部,将用户对商品的行为数据根据数据库的编码转化为行为向量,作为所述判别器的真实输入。此外,为了实现上述目的,本专利技术还提供一种基于对抗网络的商品推荐方法,包括:获得用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;根据行为数据生成随机输入向量;将随机输入向量和行为数据输入对抗网络模型,所述对抗网络模型包括生成器和判别器,所述随机输入向量输入生成器得到随机生成向量,所述随机生成向量作为判别器的虚拟输入,所述行为数据作为判别器的真实输入;所述判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,判断判别器是否收敛,当判别器不收敛时,驱动生成器更新直至判别器收敛,将所述生成器的随机生成向量作为推荐序列。优选地,所述对抗网络模型通过构建判别器的损失模型判断判别器是否收敛。进一步,优选地,所述对抗网络模型还构建生成器的损失模型,判别生成器是否收敛,当生成器或判别器不收敛时,驱动生成器更新及更新判别器和生成器的损失模型,直至生成器和判别器均收敛。优选地,所述生成器采用LSTM模型,包括:构建输入层、隐含层和输出层,输入层设置有输入门、输出层设置有输出门和遗忘门;根据下式(1)-(4)构建输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型,Si=f(a(S)xi+b(S))(1)Hj=f(a(H)Si+b(H))(2)C=f(a(C)Hj+b(C))(3)Y=f(a(Y)Hj+b(Y))(4)其中,xi为输入层第i个节点的输入,Si为xi在输入门的输入,Hj为xi在隐含层第j个节点的输出,C为xi在输出门的输出,Y为xi在遗忘门的输出,a(S),a(H),a(C),a(Y),b(S),b(H),b(C),b(Y)皆为待训练的权值参数,S,H,C,Y分别表示权值属于输入门、隐含层、输出门和遗忘门;对神经网络的权值参数进行初始赋值;对不同用户在设定时间对商品行为数据依次分为第一时间段行为数据和第二时间段行为数据,将第一时间段行为数据作为训练集,第二时间段行为数据作为输出门测试集,将不包括第二时间段行为数据中商品类的随机输入向量作为遗忘门测试集;通过训练集、输出门测试集和遗忘门测试集训练输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型。进一步,优选地,所述输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型的训练执行以下步骤:根据训练集中的一个样本生成的随机输入向量输入输入门的输入模型,得到输出门和遗忘门的输出向量,各自输出向量分别与所述样本对应的输入门测试集的输入门测试样本和遗忘门测试集的遗忘门测试样本的误差作为该样本此次训练的输出门误差和遗忘门误差,将训练集中的样本和随机输入向量的误差作为输入门误差;利用输入门误差、输出门误差和遗忘门误差根据下式(5)-(12)更新权值参数,a'(C)=a(C)+HjeC(5)b'(C)=b(C)+eC(6)a'(Y)=a(Y)+HjeY(7)b'(Y)=b(Y)+eY(8)a'(H)=a(H)+Hj(1-Hj)Si(9)b'(H)=b(H)+Hj(1-Hj)(10)a'(S)=a(S)+xieS(11)b'(S)=b(S)+eS(12)其中,eS、eC和eY分别为输入门误差、输出门误差、遗忘门误差;开始训练下一个样本,重复上述步骤,直到所有训练集样本训练结束;判断LSTM模型是否收敛,将收敛时的权值参数作为LSTM模型的权值参数。优选地,所述基于对抗网络的商品推荐方法还包括:构建数据库,对商品进行聚类编码;将用户对商品的行为数据根据数据库的编码转化为行为向量,根据行为向量生成随机输入向量,将行为向量作为判别器的真实输入。此外,为了实现上述目的,本专利技术还提供一种所述计算机可读存储介质中包括基于对抗网络的商品推荐程序,所述基于对抗网络的商品推荐程序被处理器执行时,实现上述基于对抗网络的商品推荐方法的步骤。本专利技术所述基于生成对抗网络的推荐方法、电子装置及计算机可读存储介质,对抗网络模型可以对序列数据进行建模从而更准确的学习推荐实体的特征,整体模型的集成度较高。另外,通过随机输入向量生成推荐序列,对于噪声数据具本文档来自技高网...

【技术保护点】
1.一种基于对抗网络的商品推荐方法,应用于电子装置,其特征在于,所述方法包括:获得用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;根据行为数据生成随机输入向量;将随机输入向量和行为数据输入对抗网络模型,所述对抗网络模型包括生成器和判别器,所述随机输入向量输入生成器得到随机生成向量,所述随机生成向量作为判别器的虚拟输入,所述行为数据作为判别器的真实输入;所述判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,判断判别器是否收敛,当判别器不收敛时,驱动生成器更新直至判别器收敛,将所述生成器的随机生成向量作为推荐序列。

【技术特征摘要】
1.一种基于对抗网络的商品推荐方法,应用于电子装置,其特征在于,所述方法包括:获得用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;根据行为数据生成随机输入向量;将随机输入向量和行为数据输入对抗网络模型,所述对抗网络模型包括生成器和判别器,所述随机输入向量输入生成器得到随机生成向量,所述随机生成向量作为判别器的虚拟输入,所述行为数据作为判别器的真实输入;所述判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,判断判别器是否收敛,当判别器不收敛时,驱动生成器更新直至判别器收敛,将所述生成器的随机生成向量作为推荐序列。2.根据权利要求1所述的基于对抗网络的商品推荐方法,其特征在于,所述对抗网络模型通过构建判别器的损失模型判断判别器是否收敛;所述对抗网络模型还构建生成器的损失模型,判别生成器是否收敛,当生成器或判别器不收敛时,驱动生成器更新及更新判别器和生成器的损失模型,直至生成器和判别器均收敛。3.根据权利要求1所述的基于对抗网络的商品推荐方法,其特征在于,所述生成器采用LSTM模型,包括:构建输入层、隐含层和输出层,输入层设置有输入门、输出层设置有输出门和遗忘门;根据下式(1)-(4)构建输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型,Si=f(a(S)xi+b(S))(1)Hj=f(a(H)Si+b(H))(2)C=f(a(C)Hj+b(C))(3)Y=f(a(Y)Hj+b(Y))(4)其中,xi为输入层第i个节点的输入,Si为xi在输入门的输入,Hj为xi在隐含层第j个节点的输出,C为xi在输出门的输出,Y为xi在遗忘门的输出,a(S),a(H),a(C),a(Y),b(S),b(H),b(C),b(Y)皆为待训练的权值参数,S,H,C,Y分别表示权值属于输入门、隐含层、输出门和遗忘门;对神经网络的权值参数进行初始赋值;对不同用户在设定时间对商品行为数据依次分为第一时间段行为数据和第二时间段行为数据,将第一时间段行为数据作为训练集,第二时间段行为数据作为输出门测试集,将不包括第二时间段行为数据中商品类的随机输入向量作为遗忘门测试集;通过训练集、输出门测试集和遗忘门测试集训练输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型。4.根据权利要求3所述的基于对抗网络的商品推荐方法,其特征在于,所述输入门输入模型、隐含层输出模型、输出门输出模型和遗忘门输出模型的训练执行以下步骤:根据训练集中的一个样本生成的随机输入向量输入输入门的输入模型,得到输出门和遗忘门的输出向量,各自输出向量分别与所述样本对应的输入门测试集的输入门测试样本和遗忘门测试集的遗忘门测试样本的误差作为该样本此次训练的输出门误差和遗忘门误差,将训练集中的样本和随机输入向量的误差作为输入门误差;利用输入门误差、输出门误差和遗忘门误差根据下式(5)-(12)更新权值参数,a'(C)=a(C)+HjeC(5)b'(C)=b(C)+eC(6)a'(Y)=a(Y)+HjeY(7)b'(Y)=b(Y)+eY(8)a'(H)=a(H)+Hj(1-Hj)Si(9)b'(H)=b(H)+Hj(1-Hj)(10)a'(S)=a(S)+xieS(11)b'(S)=b(S)+eS(12)其中,eS、eC和eY分别为输入门误差、输出门误差、遗忘门误差;开始训练下一个样本,重复上述步骤,直到所有训练集样本训练结束;判断LSTM模型是否收敛,将收敛时的权值参数作为LSTM模型的权值参数。5.根据权利要求1所述的基于对抗网络的商品推荐方法,其特征在于,还包括:构建数据库,对商品进行聚类编码;将用户对商品的行为数据根据数据库的编码转化为行为向量,根据行为向量生成随机输入向量,将行为向量作为判别器的真实输入。6.一种电子装置,其特征在于,所述电子装置包括存储器和处理器,所述存储器中包括基于对抗网络的商品推荐程序,所述处理器执行所述基于对抗网络的商品推荐程序,所述基于对抗网络的商品推荐程...

【专利技术属性】
技术研发人员:邓悦金戈徐亮肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1