一种应用于采购系统的数据推荐算法技术方案

技术编号:30136656 阅读:71 留言:0更新日期:2021-09-23 14:48
本发明专利技术涉及深度学习领域和数据推荐领域,具体为一种应用于采购系统的数据推荐算法,包括:步骤s1,数据进行预处理;步骤s2,对步骤1中的数据进行分词生成数据词典;步骤s3,对所有数据进行特征处理并得到相应的特征向量;步骤s4,构建词嵌入模块和构建相似性计算模块;步骤s5,将词嵌入模块、相似性计算模块依次连接后组成网络;步骤s6,将步骤s3中的训练数据对应的特征向量送到步骤s5中定义好的网络中,通过训练得到词嵌入的权重矩阵和相似性计算模型;步骤s7,将步骤s5中定义好的网络加载步骤s6得到的模型,并将测试数据对应的特征向量输入到网络中以得到测试数据实体间的相似值;步骤s8,根据实体间的相似值进行相应的推荐结果选择。选择。选择。

【技术实现步骤摘要】
一种应用于采购系统的数据推荐算法


[0001]本专利技术涉及深度学习领域和数据推荐领域,具体为一种应用于采购系统的数据推荐算法。

技术介绍

[0002]随着社会的进步和移动互联网的高速发展,我们进入了信息爆炸的时代,各种互联网服务平台和个性化的系统越来越多,提供的服务种类(如购物、视频、新闻、社交等)层出不穷,服务的“标的物”种类也越来越多,同时受教育程度大幅度提升,用户的自我个性化欲望表现也随之突出。如何在众多的标的物中为差异化个体提供精准的服务成为摆在企业面前的难题。
[0003]深度学习是基于机器学习延伸出来的新兴领域之一,它是由以人类大脑结构为启发的神经元网络为起源的基础上,在大数据和计算能力提高的情况下对网络模型结构的深度进行增加而产生的一系列新的算法,能支持处理文本、图像、序列以及语音等多种类型的数据,以回归、分类的方式来实现对预测的建模。常用深度学习模型包括卷积神经网络、自动编码器、受限波尔兹曼机以及递归神经网络等。通常使用增加神经元数目和层数的方法来提高网络的性能,但盲目的增大网络规模并不能带来预期想要的效果,网络层数增加提升性能的同时也带来了等额的计算开销。如何根据数据本身的特点和数据量来设计网络深度、网络特征图数量、优化网络层次结构、提升网络性能是需要关注和研究的方向。
[0004]近年来,基于深度学习的推荐算法越来越多,大体上分为:基于内容的推荐、协同过滤推荐、基于模型的推荐以及基于社交关系的推荐。基于内容的推荐和协同过滤推荐因为实现相对简单,且效果明显,在工业界中得到了大规模的应用,从而成为了最常用的推荐算法。其中基于内容的推荐通过对“标的物”构建属性特征,结合用户的偏好标签来进行推荐,而基于协同过滤的方法则根据“人以群分、物以类聚”的思想通过搜寻同类兴趣爱用户、同种类的“标的物”来进行个性化的推荐。这两种方法在进行推荐时都要进行不同数据间的相似性计算,如用户间、标的物间的特征相似性计算。常用的计算方法包括余弦距离、欧式距离、杰卡德系数和皮尔森相关系数等。在实际应用上述两种推荐算法时都存在非结构化数据处理难、特征数据缺失、推荐精准度不够以及海量数据下相似性计算量大的缺点。
[0005]如申请号为202011417355.2的中国专利公开的一种基于采购信息的精准个性化推荐方法包括如下步骤:获取供应商、采购商的信息,并将数据存储;对获取的信息进行数据预处理,采集满足指定词性的词,并基于采集的词采集候选标签;从基于协同过滤推荐、基于内容推荐、组合推荐的方法中选取最符合要求的推荐算法,循环遍历采购的候选标签,对候选标签进行标签抽取,得出标签集,挑选出排名居前位的供应商;将采购信息推荐给与之匹配的采购商,就会存在上述的这些缺点。

技术实现思路

[0006]本专利技术的目的是提供一种应用于采购系统的数据推荐算法。
[0007]本专利技术的上述技术目的是通过以下技术方案得以实现的:一种应用于采购系统的数据推荐算法,包括:步骤s1,训练数据和测试数据进行预处理;步骤s2,对步骤1中的数据进行分词生成数据词典;步骤s3,根据步骤2中的数据词典对所有数据进行特征处理并得到相应的特征向量;步骤s4,构建词嵌入模块和构建相似性计算模块;步骤s5,将词嵌入模块、相似性计算模块依次连接后组成网络;步骤s6,将步骤s3中的训练数据对应的特征向量送到步骤s5中定义好的网络中,通过训练得到词嵌入的权重矩阵和相似性计算模型;步骤s7,将步骤s5中定义好的网络加载步骤s6得到的模型,并将测试数据对应的特征向量输入到网络中以得到测试数据实体间的相似值;步骤s8,根据实体间的相似值进行相应的推荐结果选择。
[0008]作为对本专利技术的优选,步骤s1中的数据预处理包括非法字符的过滤、简繁体转换、去空、标点符号处理、特殊符号替换以及中文纠错和停用词处理。
[0009]作为对本专利技术的优选,训练数据和测试数据均为用户实体和供应商实体的数据。
[0010]作为对本专利技术的优选,实体的数据包括基本信息、资质信息、财务信息以及产品信息。
[0011]作为对本专利技术的优选,所述训练数据和测试数据以8:2的比例进行划分。
[0012]作为对本专利技术的优选,步骤s2中,通过结巴分词工具进行分词。
[0013]作为对本专利技术的优选,步骤s3中,根据数据在词典中的位置将文本数据映射为特征向量。
[0014]作为对本专利技术的优选,在词嵌入模块中对特征向量进行降维处理,降维处理使用不包含激活函数的全连接网络层通过线性判别分析方法进行。
[0015]作为对本专利技术的优选,在相似性计算模块,使用余弦相似性或内积函数作为相似性计算方法。
[0016]作为对本专利技术的优选,步骤s7中,采用前向运算进行推断以得到待测试数据实体间的相似值。
[0017]作为对本专利技术的优选,步骤s6中,采用误差反向传播算法训练网络,目标函数采用复合了正负样本的边界分值损失函数。
[0018]作为对本专利技术的优选,目标函数为:,其中Loss被定义为边界分值损失,其实现为:,为边界值, 其值设为1;(a, b)、(a,b

)为正负样本对。
[0019]本专利技术的有益效果:1.使用词嵌入的方式来处理数据的特征,减少了非结构化数据特征处理的复杂度。
[0020]2.通过模型训练的方式,提高相似性计算函数在指定数据集上的表现从而提高推荐的精准度。
[0021]3.方法具有普遍适用性,能很好的解决小批量数据冷启动表现差的问题。
附图说明
[0022]图1为本专利技术中一种基于神经网络的模型构造示意图;图2为本专利技术在采购系统中流程示意图。
具体实施方式
[0023]以下具体实施例仅仅是对本专利技术的解释,其并不是对本专利技术的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本专利技术的权利要求范围内都受到专利法的保护。
[0024]实施例,如图1、2所示,一种应用于采购系统的数据推荐算法,包括:步骤s1,训练数据和测试数据进行预处理;步骤s2,对步骤1中的数据进行分词生成数据词典;步骤s3,根据步骤2中的数据词典对所有数据进行特征处理并得到相应的特征向量;步骤s4,构建词嵌入模块和构建相似性计算模块;步骤s5,将词嵌入模块、相似性计算模块依次连接后组成网络;步骤s6,将步骤s3中的训练数据送到步骤s5中定义好的网络中,通过训练得到词嵌入的权重矩阵和相似性计算模型;步骤s7,将步骤s5中定义好的网络加载步骤s6得到的模型,并将测试数据对应的特征向量输入到网络中以得到测试数据实体间的相似值;步骤s8,根据实体间的相似值进行相应的推荐结果选择。
[0025]上述总体的方案就能有效在采购系统中进行采购相关的推荐。使用词嵌入的方式来处理数据的特征,减少了非结构化数据特征处理的复杂度,配合相似性计算模块,使得训练得到的模型更加可靠。
[0026]上述各个步骤更为优选的方案设置包括:步骤s1中的数据预处理可以包括非法字符本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于采购系统的数据推荐算法,其特征在于,包括:步骤s1,训练数据和测试数据进行预处理;步骤s2,对步骤1中的数据进行分词生成数据词典;步骤s3,根据步骤2中的数据词典对所有数据进行特征处理并得到相应的特征向量;步骤s4,构建词嵌入模块和构建相似性计算模块;步骤s5,将词嵌入模块、相似性计算模块依次连接后组成网络;步骤s6,将步骤s3中的训练数据对应的特征向量送到步骤s5中定义好的网络中,通过训练得到词嵌入的权重矩阵和相似性计算模型;步骤s7,将步骤s5中定义好的网络加载步骤s6得到的模型,并将测试数据对应的特征向量输入到网络中以得到测试数据实体间的相似值;步骤s8,根据实体间的相似值进行相应的推荐结果选择。2.根据权利要求1所述的一种应用于采购系统的数据推荐算法,其特征在于,步骤s1中的数据预处理包括非法字符的过滤、简繁体转换、去空、标点符号处理、特殊符号替换以及中文纠错和停用词处理。3.根据权利要求1所述的一种应用于采购系统的数据推荐算法,其特征在于,训练数据和测试数据均为用户实体和供应商实体的数据。4.根据权利要求1所述的一种应用于采购系统的数据推荐算法,其特征在于...

【专利技术属性】
技术研发人员:钱仲文吴臻顾晔洪文明孙小江王克平蒋跃军陈甜妹岑雷扬陈香陈年旅
申请(专利权)人:国网浙江浙电招标咨询有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1