一种基于卷积神经网络的图书采购推荐方法及装置制造方法及图纸

技术编号：24091449 阅读：29 留言：0更新日期：2020-05-09 08:15

本发明专利技术公开了一种基于卷积神经网络的图书采购推荐方法及装置，首先，获取历史书单数据和历史订单数据；然后将历史书单数据与历史订单数据进行匹配，根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别；接着从带有标签的历史书单数据划分出训练集；接下来将训练集中包含的信息转化为向量的表示形式；再利用训练集对应的向量对预先构建的神经网络模型进行训练；最后将待处理图书的信息转换为向量后，传入训练好的神经网络模型，得到待处理图书的采购推荐结果。本发明专利技术的方法可以利用构建的神经网络模型对图书进行购买推荐，并实现了推荐效率以及推荐准确性的提高。

A method and device of book purchase recommendation based on convolution neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的图书采购推荐方法及装置
本专利技术涉及深度学习中自然语言处理
，具体涉及一种基于卷积神经网络的图书采购推荐方法及装置。
技术介绍
图书采访在图书资讯学中，是指图书书籍的采购与访视，是图书馆征集图书的工作，其中“采”是指通过各种渠道进行广泛采集，“访”是指广泛系统地进行研究调查。现有技术的图书采购方法，一般是通过读者调查采集图书信息，然后结合学科特点进行图书信息的分析整理，再制定图书采购计划，进而进行图书采购。本申请专利技术人在实施本专利技术的过程中，发现现有技术的方法，至少存在如下技术问题：现有技术中的方法，通过人工的方式调查采集图书信息，一方面采集效率不高，并且依赖人工的经验进行采集，容易忽略一些信息，导致采集的信息不全面，进而影响制定采购计划的准确性。由此可知，现有技术中的方法存在效率和准确性不高的技术问题。
技术实现思路
本专利技术旨在利用深度学习的方法协助图书馆工作人员筛选图书，并达到提高推荐效率和准确性的目的。为了实现上述目的，本专利技术提供了一种基于卷积神经网络的图书采购推荐方法，包括：步骤S1：获取历史书单数据和历史订单数据；步骤S2：将历史书单数据与历史订单数据进行匹配，根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别，作为历史书单数据的标签；步骤S3：从带有标签的历史书单数据划分出训练集；步骤S4：将训练集中包含的信息转化为向量的表示形式；步骤S

【技术保护点】
1.一种基于卷积神经网络的图书采购推荐方法，其特征在于，包括：/n步骤S1：获取历史书单数据和历史订单数据；/n步骤S2：将历史书单数据与历史订单数据进行匹配，根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别，作为历史书单数据的标签；/n步骤S3：从带有标签的历史书单数据划分出训练集；/n步骤S4：将训练集中包含的信息转化为向量的表示形式；/n步骤S5：利用训练集对应的向量对预先构建的神经网络模型进行训练；/n步骤S6：将待处理图书的信息转换为向量后，传入训练好的神经网络模型，得到待处理图书的采购推荐结果。/n

【技术特征摘要】
1.一种基于卷积神经网络的图书采购推荐方法，其特征在于，包括：
步骤S1：获取历史书单数据和历史订单数据；
步骤S2：将历史书单数据与历史订单数据进行匹配，根据匹配结果将历史书单数据中的图书划分为购买和未购买两个类别，作为历史书单数据的标签；
步骤S3：从带有标签的历史书单数据划分出训练集；
步骤S4：将训练集中包含的信息转化为向量的表示形式；
步骤S5：利用训练集对应的向量对预先构建的神经网络模型进行训练；
步骤S6：将待处理图书的信息转换为向量后，传入训练好的神经网络模型，得到待处理图书的采购推荐结果。

2.如权利要求1所述的方法，其特征在于，步骤S2具体包括：
步骤S2.1：将历史书单数据与历史订单数据进行匹配；
步骤S2.2：如果历史书单数据中包含的图书出现在历史订单数据中，则将历史书单数据中包含图书的类别标记为购买，否则，将历史书单数据中包含图书的类别标记为未够买，得到带有标签的历史书单数据。

3.如权利要求1所述的方法，其特征在于，步骤S4具体包括：
步骤S4.1：将训练集中包含的信息与预先构建的字典库进行匹配，其中，预先构建的字典库中包含汉字以及其对应的词向量表示；
步骤S4.2：根据匹配情况，将训练集中包含的信息转换为对应的词向量表示。

4.如权利要求3所述的方法，其特征在于，字典库的构建方法为：
统计历史书单数据中汉字的出现次数；
删除出现次数少于阈值的汉字以及作为停用词的汉字，将剩余的汉字构建字典库。

5.如权利要求3所述的方法，其特征在于，与汉字对应的词向量表示的构建方法为：
将字典库的大小限制为包含预设数量的汉字；
采用tensorflow库中的初始化方法生成每个汉字对应的词向量。

6.如权利要求1所述的方法，其特征在于，训练集中包含的信息为文本序列，步骤S...

【专利技术属性】
技术研发人员：郭迟，余佩林，黄勇凯，
申请(专利权)人：中山赛伯坦智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人