一种基于卷积神经网络的图书采购推荐方法及装置制造方法及图纸

技术编号:24091449 阅读:29 留言:0更新日期:2020-05-09 08:15
本发明专利技术公开了一种基于卷积神经网络的图书采购推荐方法及装置,首先,获取历史书单数据和历史订单数据;然后将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别;接着从带有标签的历史书单数据划分出训练集;接下来将训练集中包含的信息转化为向量的表示形式;再利用训练集对应的向量对预先构建的神经网络模型进行训练;最后将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。本发明专利技术的方法可以利用构建的神经网络模型对图书进行购买推荐,并实现了推荐效率以及推荐准确性的提高。

A method and device of book purchase recommendation based on convolution neural network

【技术实现步骤摘要】
一种基于卷积神经网络的图书采购推荐方法及装置
本专利技术涉及深度学习中自然语言处理
,具体涉及一种基于卷积神经网络的图书采购推荐方法及装置。
技术介绍
图书采访在图书资讯学中,是指图书书籍的采购与访视,是图书馆征集图书的工作,其中“采”是指通过各种渠道进行广泛采集,“访”是指广泛系统地进行研究调查。现有技术的图书采购方法,一般是通过读者调查采集图书信息,然后结合学科特点进行图书信息的分析整理,再制定图书采购计划,进而进行图书采购。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:现有技术中的方法,通过人工的方式调查采集图书信息,一方面采集效率不高,并且依赖人工的经验进行采集,容易忽略一些信息,导致采集的信息不全面,进而影响制定采购计划的准确性。由此可知,现有技术中的方法存在效率和准确性不高的技术问题。
技术实现思路
本专利技术旨在利用深度学习的方法协助图书馆工作人员筛选图书,并达到提高推荐效率和准确性的目的。为了实现上述目的,本专利技术提供了一种基于卷积神经网络的图书采购推荐方法,包括:步骤S1:获取历史书单数据和历史订单数据;步骤S2:将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别,作为历史书单数据的标签;步骤S3:从带有标签的历史书单数据划分出训练集;步骤S4:将训练集中包含的信息转化为向量的表示形式;步骤S5:利用训练集对应的向量对预先构建的神经网络模型进行训练;步骤S6:将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。在一种实施方式中,步骤S2具体包括:步骤S2.1:将历史书单数据与历史订单数据进行匹配;步骤S2.2:如果历史书单数据中包含的图书出现在历史订单数据中,则将历史书单数据中包含图书的类别标记为购买,否则,将历史书单数据中包含图书的类别标记为未够买,得到带有标签的历史书单数据。在一种实施方式中,步骤S4具体包括:步骤S4.1:将训练集中包含的信息与预先构建的字典库进行匹配,其中,预先构建的字典库中包含汉字以及其对应的词向量表示;步骤S4.2:根据匹配情况,将训练集中包含的信息转换为对应的词向量表示。在一种实施方式中,字典库的构建方法为:统计历史书单数据中汉字的出现次数;删除出现次数少于阈值的汉字以及作为停用词的汉字,将剩余的汉字构建字典库。在一种实施方式中,与汉字对应的词向量表示的构建方法为:将字典库的大小限制为包含预设数量的汉字;采用tensorflow库中的初始化方法生成每个汉字对应的词向量。在一种实施方式中,训练集中包含的信息为文本序列,步骤S4.2具体包括:将文本序列设置为预设长度;将文本序列中出现的每个汉字转化为字典库中对应的词向量表示,生成一个词向量矩阵。在一种实施方式中,训练好的神经网络模型包括一个输入层、至少一个卷积层、一个汇聚层和一个全连接层,在卷积层中设置不同大小的卷积核,步骤S6具体包括:步骤S6.1:通过输入层对转换后的向量进行处理后送入卷积层;步骤S6.2:通过卷积层中设置的不同大小的卷积核提取不同长度的特征图;步骤S6.3:通过汇聚层将不同长度的特征图进行降维处理,得到处理后的特征图;步骤S6.4:通过全连接层对处理后的特征图进行处理,得到概率值;步骤S6.5:通过输出层将概率值进行输出;步骤S6.6:根据输出的概率值大小,获得图书购买推荐结果。基于同样的专利技术构思,本专利技术第二方面提供了一种基于卷积神经网络的图书采购推荐装置,包括:数据获取模块,用于获取历史书单数据和历史订单数据;数据匹配模块,用于将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据的图书划分为购买和未购买两个类别,作为历史书单数据的标签;数据划分模块,用于从带有标签的历史书单数据划分出训练集;数据转化模块,用于将训练集中包含的信息转化为向量的表示形式;训练模块,用于利用训练集对应的向量对预先构建的神经网络模型进行训练;推荐模块,用于将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。基于同样的专利技术构思,本专利技术第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。基于同样的专利技术构思,本专利技术第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本专利技术提供的一种基于卷积神经网络的图书采购推荐方法,首先,获取历史书单数据和历史订单数据;然后将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别;接着从带有标签的历史书单数据划分出训练集;接下来将训练集中包含的信息转化为向量的表示形式;再利用训练集对应的向量对预先构建的神经网络模型进行训练;最后将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。本专利技术将深度学习技术引入到图书采访技术中,提供了一种基于卷积神经网络的图书采购推荐方法,首先根据历史书单数据与历史订单数据的匹配情况,对历史书单数据划分标签,并作为训练集用于后续模型的训练,并将训练集中包含的文本信息转化为向量的表示形式,然后利用训练集对应的向量对预先构建的神经网络模型进行训练;最后则可以利用训练好的神经网络模型进行采购推荐,一方面,本专利技术提供的方法中通过神经网络模型来进行采购推荐,可以提高效率,另一方面,由于模型的训练集是根据历史书单数据与历史订单数据匹配后选取出的,通过训练集的训练,可以得到效果较好的神经网络模型,从而可以提高推荐的准确性。进一步地,将文本序列设置为预设长度,并将文本序列中出现的每个汉字转化为字典库中对应的词向量表示,生成一个词向量矩阵,从而进行训练,即用一段有限长度的汉字来表示一本图书的文本特征并对其中所有汉字进行汉字-向量的转换,使得模型能够处理汉字信息。进一步地,对每一本图书的向量表示用不同的卷积核提取出不同长度的特征映射,使得提取的特征更加多样化,并通过汇聚层对这些特征映射进行降维处理,然后将其拼接到一起最后传入全连接层进行处理,最终得到推荐概率,从而可以进一步提高模型的性能,提高准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。...

【技术保护点】
1.一种基于卷积神经网络的图书采购推荐方法,其特征在于,包括:/n步骤S1:获取历史书单数据和历史订单数据;/n步骤S2:将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别,作为历史书单数据的标签;/n步骤S3:从带有标签的历史书单数据划分出训练集;/n步骤S4:将训练集中包含的信息转化为向量的表示形式;/n步骤S5:利用训练集对应的向量对预先构建的神经网络模型进行训练;/n步骤S6:将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。/n

【技术特征摘要】
1.一种基于卷积神经网络的图书采购推荐方法,其特征在于,包括:
步骤S1:获取历史书单数据和历史订单数据;
步骤S2:将历史书单数据与历史订单数据进行匹配,根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别,作为历史书单数据的标签;
步骤S3:从带有标签的历史书单数据划分出训练集;
步骤S4:将训练集中包含的信息转化为向量的表示形式;
步骤S5:利用训练集对应的向量对预先构建的神经网络模型进行训练;
步骤S6:将待处理图书的信息转换为向量后,传入训练好的神经网络模型,得到待处理图书的采购推荐结果。


2.如权利要求1所述的方法,其特征在于,步骤S2具体包括:
步骤S2.1:将历史书单数据与历史订单数据进行匹配;
步骤S2.2:如果历史书单数据中包含的图书出现在历史订单数据中,则将历史书单数据中包含图书的类别标记为购买,否则,将历史书单数据中包含图书的类别标记为未够买,得到带有标签的历史书单数据。


3.如权利要求1所述的方法,其特征在于,步骤S4具体包括:
步骤S4.1:将训练集中包含的信息与预先构建的字典库进行匹配,其中,预先构建的字典库中包含汉字以及其对应的词向量表示;
步骤S4.2:根据匹配情况,将训练集中包含的信息转换为对应的词向量表示。


4.如权利要求3所述的方法,其特征在于,字典库的构建方法为:
统计历史书单数据中汉字的出现次数;
删除出现次数少于阈值的汉字以及作为停用词的汉字,将剩余的汉字构建字典库。


5.如权利要求3所述的方法,其特征在于,与汉字对应的词向量表示的构建方法为:
将字典库的大小限制为包含预设数量的汉字;
采用tensorflow库中的初始化方法生成每个汉字对应的词向量。


6.如权利要求1所述的方法,其特征在于,训练集中包含的信息为文本序列,步骤S...

【专利技术属性】
技术研发人员:郭迟余佩林黄勇凯
申请(专利权)人:中山赛伯坦智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1