基于卷积注意力的矩阵分解方法、装置及电子设备制造方法及图纸

技术编号:21116728 阅读:51 留言:0更新日期:2019-05-16 09:17
本发明专利技术涉及一种基于卷积注意力的矩阵分解方法、装置及电子设备。本发明专利技术所述的基于卷积注意力的矩阵分解方法包括如下步骤:将物品的用户描述文档表示为词向量矩阵;将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子;对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,并根据内积建立预测评分矩阵;使用误差反向传播算法,优化所述卷积注意力神经网络的参数和所述概率矩阵分解。本发明专利技术所述的基于卷积注意力的矩阵分解方法可解释性好,能有效减轻物品冷启动问题,并能改善数据稀疏问题,提高评分预测的准确率。

Matrix Decomposition Method, Device and Electronic Equipment Based on Convolutional Attention

【技术实现步骤摘要】
基于卷积注意力的矩阵分解方法、装置及电子设备
本专利技术涉及数据处理
,特别是涉及一种基于卷积注意力的矩阵分解方法、装置及电子设备。
技术介绍
基于矩阵分解的推荐方法是目前一种常用的基本方法,通过分解给定用户对物品的评分矩阵,用两个低秩矩阵的乘积来逼近原来的评分矩阵,逼近的目标就是使预测的评分矩阵和原来的评分矩阵之间的误差平方最小。两个低秩矩阵分别为用户和物品的特征矩阵,矩阵中的这些特征向量可以简单地理解为用户对不同属性的偏好。与基于内容的过滤方法相比,矩阵分解具有较好的领域适应性,能够处理非结构化的数据,如音乐、视频等。但存在数据稀疏和冷启动问题。这是因为,纯粹的矩阵分解忽略了物品的评论文本和描述文本的隐含特征,使得矩阵分解的预测性能受限。现有的评分预测将用户对物品的评分信息看作单纯的评分,没有从用户和物品的角度,深入思考用户对不同物品的评分和不同用户对同一物品的评分所蕴含的深层含义,简单的矩阵分解无法添加文本特征,不能深入理解用户对物品的评论文本,因此无法解决冷启动和推荐的可解释性问题。卷积神经网络可用于提取文本的隐含特征,但是卷积神经网络往往忽略对单一词的特征提取,而且文本中不同词对评分预测的重要性不一,而大部分工作没有考虑不同词对评分预测的差异性。
技术实现思路
基于此,本专利技术的目的在于,提供一种基于卷积注意力的矩阵分解方法,其可解释性好,能有效减轻物品冷启动问题,并能改善数据稀疏问题,提高评分预测的准确率。本专利技术基于卷积注意力的矩阵分解方法是通过如下方案实现的:一种基于卷积注意力的矩阵分解方法,包括如下步骤:将物品的用户描述文档表示为词向量矩阵;将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子;对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,得到用户对物品的预测评分,并根据用户对物品的预测评分建立预测评分矩阵;根据所述预测评分矩阵与真实评分矩阵之间的损失函数,使用误差反向传播算法,优化所述卷积注意力神经网络的参数和所述概率矩阵分解。本专利技术所述的基于卷积注意力的矩阵分解方法,通过卷积注意力神经网络提取物品的隐含因子,根据用户对物品的评分信息和物品的隐含因子获取用户的隐含因子,对所述物品的隐含因子和所述用户的隐含因子计算向量的内积得到预测评分,并根据预测评分矩阵与真实评分矩阵之间的损失函数,使用反向传播算法减小误差,优化所述卷积注意力神经网络和所述概率矩阵分解,其可解释性好,能有效减轻物品冷启动问题,并能改善数据稀疏问题,提高评分预测的准确率。在一种实施例中,将物品的用户描述文档表示为词向量矩阵前,还包括如下步骤:去除所述用户描述文档中频率过高的词汇;去除所述用户描述文档中频率过低的词汇。通过对用户描述文档进行筛选,能更准确地获取用户描述文档的词向量矩阵。在一种实施例中,根据物品的用户评分信息,获取用户的隐含因子前,还包括如下步骤:去除没有用户描述文档的物品。在一种实施例中,对所述物品的隐含因子和所述用户的隐含因子计算向量的内积前,还包括如下步骤:根据物品的评分数量对所述物品赋予不同程度的高斯噪声,其中,评分数量越少,所赋予的高斯噪声越大。通过物品的评分数量对所述物品赋予不同程度的高斯噪声,可以提高所述物品隐含因子的鲁棒性。进一步地,本专利技术还提供一种基于卷积注意力的矩阵分解装置,包括:词向量矩阵模块,用于将物品的用户描述文档表示为词向量矩阵;物品隐含因子获取模块,用于将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;用户隐含因子获取模块,用于根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子;概率矩阵分解模块,用于对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,得到用户对物品的预测评分,并根据用户对物品的预测评分建立预测评分矩阵;优化模块,用于根据所述预测评分矩阵与真实评分矩阵之间的损失函数,使用误差反向传播算法,优化所述卷积注意力神经网络的参数和所述概率矩阵分解。本专利技术所述的基于卷积注意力的矩阵分解装置,通过卷积注意力神经网络提取物品的隐含因子,根据用户对物品的评分信息和物品的隐含因子获取用户的隐含因子,对所述物品的隐含因子和所述用户的隐含因子计算向量的内积得到预测评分,并根据预测评分矩阵与真实评分矩阵之间的损失函数,使用反向传播算法减小误差,优化所述卷积注意力神经网络和所述概率矩阵分解,其可解释性好,能有效减轻物品冷启动问题,并能改善数据稀疏问题,提高评分预测的准确率。在一种实施例中,还包括:第一预处理模块,用于将物品的用户描述文档表示为词向量矩阵前,去除所述用户描述文档中频率过高的词汇,以及去除所述用户描述文档中频率过低的词汇。在一种实施例中,还包括:第二预处理模块,用于根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子前,去除没有用户描述文档的物品。在一种实施例中,还包括:高斯噪声赋予模块,用于对所述物品的隐含因子和所述用户的隐含因子计算向量的内积前,根据物品的评分数量对所述物品赋予不同程度的高斯噪声,其中,评分数量越少,所赋予的高斯噪声越大。进一步地,本专利技术还提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任意一项基于卷积注意力的矩阵分解方法。进一步地,本专利技术还提供一种电子设备,包括存储器、处理器以及储存在所述存储器并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的任意一项基于卷积注意力的矩阵分解方法。为了更好地理解和实施,下面结合附图详细说明本专利技术。附图说明图1为一种实施例中基于卷积注意力的矩阵分解方法流程图;图2为一种实施例中对物品描述文档预处理流程图;图3为基于卷积注意力的矩阵分解模型示意图;图4为卷积注意力神经网络的结构示意图;图5为一种实施例中基于卷积注意力的矩阵分解模型的优化流程示意图;图6为一种实施例中基于卷积注意力的矩阵分解方法流程图;图7为一种实施例中基于卷积注意力的矩阵分解装置结构示意图;图8为一种实施例中电子设备结构示意图。具体实施方式请参阅图1,在一种实施例中,本专利技术基于卷积注意力的矩阵分解方法包括如下步骤:步骤S101:将物品的用户描述文档表示为词向量矩阵。步骤S102:将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子。所述物品包括用户购买、或使用的商品,包括实务商品,也包括电影、电视剧、书籍等商品,所述用户描述文档为用户对该物品发表的评论,所述用户评分信息为用户对该物品所发表的评分信息。所述词向量矩阵通过词嵌入层,将物品的描述文档映射到向量空间,向量之间的距离表征了描述文档中,词与词之间的语义关系。所述卷积注意力神经网络包括注意力层,用于提取用户描述文档的局部特征,所述物品的隐含因子,为隐语义模型中,物品与隐类之间的关系矩阵。步骤S103:根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子。所述用户的隐含因子,为隐语义模型中,用户评分与隐类之间的关系矩阵。步骤S104:对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,得到用户对物品的预测评分,并根据用户对物品的预测评分建立预测评分本文档来自技高网...

【技术保护点】
1.一种基于卷积注意力的矩阵分解方法,其特征在于,包括如下步骤:将物品的用户描述文档表示为词向量矩阵;将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子;对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,得到用户对物品的预测评分,并根据用户对物品的预测评分建立预测评分矩阵;根据所述预测评分矩阵与真实评分矩阵之间的损失函数,使用误差反向传播算法,优化所述卷积注意力神经网络的参数和所述概率矩阵分解。

【技术特征摘要】
1.一种基于卷积注意力的矩阵分解方法,其特征在于,包括如下步骤:将物品的用户描述文档表示为词向量矩阵;将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子;对所述物品的隐含因子和所述用户的隐含因子计算向量的内积,得到用户对物品的预测评分,并根据用户对物品的预测评分建立预测评分矩阵;根据所述预测评分矩阵与真实评分矩阵之间的损失函数,使用误差反向传播算法,优化所述卷积注意力神经网络的参数和所述概率矩阵分解。2.根据权利要求1所述的基于卷积注意力的矩阵分解方法,其特征在于,将物品的用户描述文档表示为词向量矩阵前,还包括如下步骤:去除所述用户描述文档中频率过高的词汇;去除所述用户描述文档中频率过低的词汇。3.根据权利要求1所述的基于卷积注意力的矩阵分解方法,其特征在于,根据用户对物品的评分信息和物品的隐含因子,使用概率矩阵分解获取用户的隐含因子前,还包括如下步骤:去除没有用户描述文档的物品。4.根据权利要求1所述的基于卷积注意力的矩阵分解方法,其特征在于,对所述物品的隐含因子和所述用户的隐含因子计算向量的内积前,还包括如下步骤:根据物品的评分数量对所述物品赋予不同程度的高斯噪声,其中,评分数量越少,所赋予的高斯噪声越大。5.一种基于卷积注意力的矩阵分解装置,其特征在于,包括:词向量矩阵模块,用于将物品的用户描述文档表示为词向量矩阵;物品隐含因子获取模块,用于将所述词向量矩阵输入卷积注意力神经网络,获取物品的隐含因子;用户隐含因子获取模块,用于根据用户对物品的评...

【专利技术属性】
技术研发人员:曾碧卿商齐
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1