一种基于封面的书籍类型深度学习分类方法技术

技术编号：28321894 阅读：17 留言：0更新日期：2021-05-04 13:02

本发明专利技术涉及图书管理技术领域，更具体而言，涉及一种基于封面的书籍类型深度学习分类方法。包括以下步骤：S1、收集图书封面图像并制作训练数据集DTP；S2、将训练数据集DTP输入深度学习模型并进行训练；S3、使用S2所得到的深度学习模型对书籍进行分类。S2中，深度学习模型包括两个深度学习网络、一个全连接层和一个softmax分类器，基于视觉的深度学习网络使用残差神经网络模型，基于文本的深度学习网络使用通用句子编码器模型。本发明专利技术具有更高的分类准确率和更高的适用性和稳定性，能够对书籍进行快速，有效的分类，精度高，速度快。本发明专利技术主要应用与书籍类型分类方面。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于封面的书籍类型深度学习分类方法
本专利技术涉及图书管理
，更具体而言，涉及一种基于封面的书籍类型深度学习分类方法。
技术介绍
书的封面通常是读者的第一印象，它们经常传达关于书的内容的重要信息。随着图书的完全数字化进程的不断推进，基于封面的图书类型分类对于许多现代检索系统来说是一项极其重要的内容。解决此问题的主要难点如下：第一，书的体裁种类繁多，有很多没有具体界定；第二，书的封面，如颜色，风格，文本信息等，即使是同一类型的书之间，也具有很大的差异；第三，由于国家、文化、目标读者群体等外部因素的影响，书籍的封面设计也会有所不同。随着图书行业的竞争力日益增强，为了能吸引读者，图书封面设计师将封面设计推向了一个新的高度。广东技术师范大学蔡君等人在其申请的专利文献“一种基于深度学习的书脊文本识别方法、设备及存储介质”(申请号202010182949.3申请日2020.09.18申请公布号：CN111680684A)中公开了一种基于深度学习的书脊文本识别方法、设备及存储介质。该
技术实现思路
包括：制作合成书脊、单字多字体和真实书脊数据集；基于CTPN模型对单本书脊进行文本检测；针对文本模糊特点搭建基于ResNet10的书脊文本识别模型STRNet；针对字体多样特点制作SK-NNS分类器等。该专利技术的不足之处为：该专利技术仅是书籍的文字信息识别，并未直接进行书籍分类，识别文本后仍需人工进行书籍分类，故该专利技术在实际使用中具有很大的局限性。
技术实现思路
为克服上述现有技术中存在的不足，本...

【技术保护点】
1.一种基于封面的书籍类型深度学习分类方法，其特征在于，包括以下步骤：/nS1、收集图书封面图像并制作训练数据集DTP；/nS2、将训练数据集DTP输入深度学习模型并进行训练；/nS3、使用S2所得到的深度学习模型对书籍进行分类。/n

【技术特征摘要】
1.一种基于封面的书籍类型深度学习分类方法，其特征在于，包括以下步骤：
S1、收集图书封面图像并制作训练数据集DTP；
S2、将训练数据集DTP输入深度学习模型并进行训练；
S3、使用S2所得到的深度学习模型对书籍进行分类。

2.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法，其特征在于：所述步骤S1中，操作步骤为：
S1a、收集大量图书封面图像，根据体裁进行将这些图像分为30个类别并进行标注；
S1b、将所有的图像调整到224×224的大小，得到图像数据DP；
S1c、使用视觉应用编程接口对数据集进行文本提取，得到文本数据DT；
S1d、将图像数据DP、文本数据DT和标注类别数据共同组成训练数据集DTP。

3.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法，其特征在于：所述步骤S2中，操作步骤为：
S2a、将训练数据集DTP中的图像数据DP输入基于视觉的深度学习网络；
S2b、将训练数据集DTP中的文本数据DT输入基于文本的深度学习网络；
S2c、将两个深度学习的输出进行直接拼接合并，得到全连接层；
...

【专利技术属性】
技术研发人员：潘晓光，潘晓辉，王小华，张娜，董虎弟，
申请(专利权)人：山西三友和智慧信息技术股份有限公司，
类型：发明
国别省市：山西;14

全部详细技术资料下载我是这个专利的主人