基于属性贡献度掩码的多源数据融合商品推荐方法技术

技术编号：37112364 阅读：31 留言：0更新日期：2023-04-01 05:09

基于属性贡献度掩码的多源数据融合商品推荐方法，包括：1)通过网络收集对于商品的评论，包括图片，文字，视频；2)训练自编码器；3)提取降维数据；4)融合数据；5)训练深度模型；6)掩膜法计算权重；7)获得每个维度数据的权重，对于每个数据中每一维度的权重进行微调；8)对评分预测模型进行重训练，得到最终的评分预测模型；9)采用知识图谱的方式进行预测，利用老产品数据预测新产品数据；10)进行新老产品的评分预测，根据评分结果进行推荐。本发明专利技术提高了系统的准确性、系统输出的可信度。系统输出的可信度。系统输出的可信度。

全部详细技术资料下载

【技术实现步骤摘要】
基于属性贡献度掩码的多源数据融合商品推荐方法

[0001]本专利技术涉及机器学习领域，具体涉及一种多源数据融合商品推荐方法。

技术介绍

[0002]在经济增长，人均收入逐渐提高的背景下，人们的消费力也逐渐提高，饮料作为一种口味独特的饮品，深受各类人群喜爱，而随着饮料种类的不断增多，市场已经逐渐趋于饱和，口味的推出速度也趋于减慢，因此如何使用更加先进的市场营销推荐手段，从而在市场中占据更多的份额也逐渐重要，传统的推荐手段对于信息的收集以及处理方式存在着滞后性的缺点，已经逐渐无法满足日新月异的市场，并且传统的手段中大量依赖人工进行处理，效率较低的同时也大量需要系统人员的经验进行判断，具有巨大的主观性，无法较好的完成推荐系统的制定，因此新的推荐手段探索志在必行。
[0003]随着信息技术的飞速发展，德国、美国先后提出“工业4.0”“工业互联网”等概念，云计算、大数据和物联网等数字技术日渐成熟，全球经济逐渐开始向数字经济转型。数字化对社会经济的重大影响已然成为重要共识，数字经济已经成为我国经济发展的重要驱动。而在推荐系统方面...

【技术保护点】

【技术特征摘要】
1.基于属性贡献度掩码的多源数据融合商品推荐方法，包括如下步骤：1)收集数据：通过网络收集对于饮料的评论，包括图片，文字，视频，经过处理后存入到数据集S0中；2)训练自编码器：由于往往从网络上收集的数据为多源数据，包含非结构化，半结构化以及结构化数据，对于非结构化数据或者半结构化数据需要进行结构化，采用自编码器的方法进行求解，首先对自编码器进行训练，具体方法如下：2.1)自编码器是一个自监督学习的算法，将数据进行降维，通过训练映射f:x
→
x`，从而训练神经模型，具体方法如下:(Ⅰ)已有无标签的数据集S0，将其中的70％存入空数据集S
01
中，作为训练集，剩余的30％的数据作为验证集存入空数据集S
02
中；(Ⅱ)利用训练集中数据，训练子网络M
11
来学习映射f1:x
→
z，其中z为一个维度小于m的数据，将所得到的z存入数据集S
13
中；(Ⅲ)利用得到的数据集S
13
中的数据z作为输入训练子网络M
12
，学习映射f:z
→
x`，其中x`为一个和原数据x相同维度的数据，将所得的x`存入数据集中(Ⅳ)利用反向传播对两个子网络进行调整，将距离度量最小化的方式，来获得最终所需要的自编码器M1，其中距离度量的计算公式如下：其中n代表训练的数据的数量，L代表距离度量；3)提取降维数据：根据步骤2)中已训练的自编码器M1对于多元数据进行融合，将已有数据集S0中需要融合的数据x输入到自编码器M1中，将所得到的中间产生的数据z取出，由于自编码器中间数据z相当于对于输入数据进行了一次降维，因此相当于提取了数据中的共同特征；4)融合数据：将S0中的数据与其对应的中间数据z进行相加，将所得结果存入数据集S1中，作为训练模型的数据；5)训练深度模型：利用数据集S1中的数据训练深度模型M2，使用反向传播技术进行训练，将损失函数最小化，具体损失函数如下：6)计算权重：通过步骤5)初步获得一个商品评分模型M2，但其中各维度属性权重依旧相同，为了提高准确度，使用掩膜的方法进行解决，具体方法如下：6.1)将S1中的数据输入到已有的评分模型M2中，即可获得输出结果即评分f(x)，每个数据都对应一个输出结果f(x
i
)；6.2)对于每个数据评分f(x
i
)进行求导工作，求导结果g
ia
,即为第i个数据中第a维数据对于输出结果f(x
i

【专利技术属性】
技术研发人员：郑海斌，项云鹏，任启伟，杨洁，杨丁一，陈晋音，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人