书籍搜索方法、装置和系统制造方法及图纸

技术编号:25042110 阅读:18 留言:0更新日期:2020-07-29 05:32
本发明专利技术公开了一种书籍搜索方法、装置、及系统,其中方法包括:获取书籍的封面图像;将所述封面图像转化为特征向量,作为输入特征向量;计算所述输入特征向量与预先存储的多个特征向量的相似度,根据该相似度确定要获得的目标书籍。本发明专利技术能够通过使用机器学习的方法搜索书籍封面继而搜索到需要的书籍,书籍封面相对于书籍的条码更具有严格的唯一性,通过书籍的封面进行书籍的搜索能提高用户获取书籍信息及与书籍相关的答案知识点解析等书籍中没有的信息的效率和准确率,可以让高质量的答案和知识点分析更好的传递到用户,更好的实现教育公平。

【技术实现步骤摘要】
书籍搜索方法、装置和系统
本专利技术涉及计算机信息处理领域,具体而言,涉及一种书籍搜索方法、装置、系统及系统。
技术介绍
随着现代化社会的发展,人们对知识量的需求不断增加,越来越多的人使用网络教学平台进行学习,在查找书籍过程中,一次得到整本书的答案以及知识点解析会大幅度提升检查的效率,减少了很多针对单个题目页面进行答案获取的重复劳动,用户可以通过扫描书籍的条形码定位到要寻找的书籍,但是同一个条形码可能会对应了多个书籍,使得条形码不具有严格的唯一性,难以快速准确地搜索到需要的书籍。
技术实现思路
为了解决如何快速准确的搜索到目标书籍的相关信息的技术问题,本专利技术提供了一种书籍搜索方法、装置、系统。本专利技术的一方面提供一种书籍搜索方法,用于根据书籍的封面图像搜索以获得目标书籍,包括:获取书籍的封面图像;将所述封面图像转化为特征向量,作为输入特征向量;计算所述输入特征向量与预先存储的特征向量的相似度,根据该相似度确定要获得的目标书籍。根据本专利技术的优选实施方式,所述将所述封面图像转化为输入特征向量的步骤包括:将所述封面图像进行处理得到图案特征向量;获取所述封面图像中的文字信息,将所述文字信息进行处理得到文字特征向量;将所述图案特征向量与所述文字特征向量进行组合得到所述输入特征向量。根据本专利技术的优选实施方式,所述将所述封面图像进行处理得到图案特征向量,进一步包括:将所述封面图像通过图像向量化模型进行处理得到经过特殊编码的图案像特征向量;可选地,图像向量化模型为卷积神经网络模型,至少包括VGG模型、resnet模型。根据本专利技术的优选实施方式,所述获取所述封面图像中的文字信息,将所述文字信息进行处理得到文字特征向量,进一步包括:使用锚点回归方法对书籍封面图像进行文字检测;采用循环神经网络对检测到的文字进行识别;利用词嵌入模型将识别出的文字转化为文字特征向量;可选地,所述将所述图案特征向量与所述文字特征向量进行组合得到所述输入特征向量,进一步包括:将处理得到的图案像特征向量及文字特征向量进行向量拼接;将图案特征向量与文字特征向量首尾拼接得到封面图像转化的输入特征向量;输入特征向量的维度等于图案像特征向量与文字特征向量维度的总和。根据本专利技术的优选实施方式,所述方法还包括:建立内容数据库,在该内容数据库中存储书籍内容,并为不同书籍的书籍内容分配不同的书籍ID;将所述内容数据库中的书籍的封面图像转化为特征向量,并为所述特征向量与各书籍ID建立对应关系;可选地,所述为所述特征向量与各书籍ID建立对应关系的步骤包括:建立索引数据库存储所述对应关系;可选地,所述索引数据库和所述内容数据库建立在同一服务器上。根据本专利技术的优选实施方式,所述方法还包括:所述服务器获取书籍的封面图像;将所述封面图像转化为所述输入特征向量;计算所述输入特征向量与所述索引数据中的特征向量的相似度,根据该相似度确定要获得的目标书籍的书籍ID;可选地,所述根据该相似度确定要获得的目标书籍的书籍ID的步骤包括:将所述输入特征向量与预先存储的多个特征向量的相似度按照从高到低排序;将与输入特征向量的相似度大于预定值的各特征向量对应的书籍确定为目标书籍,或者,将与输入特征向量的相似度排序靠前的预定数量的书籍确定为目标书籍;获取所述目标书籍对应的书籍ID;可选地,所述相似度的计算方式为特征向量之间的余弦距离。根据本专利技术的优选实施方式,在获取所述目标书籍对应的书籍ID后,所述方法还包括:服务器根据目标书籍对应的书籍ID从所述内容数据库获取目标书籍内容并根据客户端的请求发送给客户端;所述客户端展示所述目标书籍的以下任一项:目标书籍的书籍ID、目标书籍的封面图像、目标书籍的书籍内容。本专利技术的第二方面提供一种书籍搜索装置,用于根据书籍的封面图像搜索以获得目标书籍,包括:图像获取模块,用于获取书籍的封面图像;图像转化模块,用于将所述封面图像转化为特征向量,作为输入特征向量;目标搜索模块,用于计算所述输入特征向量与预先存储的多个特征向量的相似度,根据该相似度确定要获得的目标书籍。本专利技术的第三方面提供一种书籍搜索系统,用于根据书籍的封面图像搜索以获得目标书籍,包括客户端和服务器,其中,所述客户端包括:图像采集模块,用于获取书籍的封面图像;图像传送模块,用于将所述封面图像发送到所述服务器;内容展示模块,用于将从所述服务器获取的所述目标书籍展示给用户;所述服务器包括:特征提取模块,用于接收所述封面图像,并将所述封面图像转化为特征向量,作为输入特征向量发送到特征匹配模块;特征数据库,用于存储与书籍封面图像对应的特征向量;特征匹配模块,用于接收所述输入特征向量,计算所述输入特征向量与预先存储的所述特征数据库中的多个特征向量的相似度,根据该相似度确定要获得的目标书籍;内容数据库,用于存储书籍内容。本专利技术的第四方面提供一种客户端,用于根据书籍的封面图像搜索以获得目标书籍,包括:图像采集模块,用于获取书籍的封面图像;图像传送模块,用于将所述封面图像发送到所述服务器;内容展示模块,用于将从服务器获取所述目标书籍展示给用户。本专利技术的第五方面提供一种书籍服务器,用于向客户端提供书籍搜索和书籍数据服务,所述书籍服务器包括:特征提取模块,用于接收所述封面图像,并将所述封面图像转化为特征向量,作为输入特征向量发送到特征匹配模块;特征数据库,用于存储与书籍封面图像对应的特征向量;特征匹配模块,用于计算特征提取模块发送的所述输入特征向量与所述特征数据库中的多个特征向量的相似度,根据该相似度确定要获得的目标书籍;内容数据库,用于存储书籍内容。本专利技术的第六方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。本专利技术的技术方案,具有如下有益效果:本专利技术通过使用机器学习的方法搜索书籍封面继而搜索到需要的书籍,书籍封面相对于书籍的条码更具有严格的唯一性,通过书籍的封面进行书籍的搜索能提高用户获取书籍信息及与书籍相关的答案知识点解析等书籍中没有的信息的效率和准确率,可以让高质量的答案和知识点分析更好的传递到用户,更好的实现教育公平。附图说明为了使本专利技术所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本专利技术的具体实施例。但需声明的是,下面描述的附图仅仅是本专利技术示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。图1是本专利技术的一种书籍搜索系统的应用场景示意图;...

【技术保护点】
1.一种书籍搜索方法,用于根据书籍的封面图像搜索以获得目标书籍,其特征在于,包括:/n获取书籍的封面图像;/n将所述封面图像转化为特征向量,作为输入特征向量;/n计算所述输入特征向量与预先存储的特征向量的相似度,根据该相似度确定要获得的目标书籍。/n

【技术特征摘要】
1.一种书籍搜索方法,用于根据书籍的封面图像搜索以获得目标书籍,其特征在于,包括:
获取书籍的封面图像;
将所述封面图像转化为特征向量,作为输入特征向量;
计算所述输入特征向量与预先存储的特征向量的相似度,根据该相似度确定要获得的目标书籍。


2.根据权利要求1所述的方法,其特征在于,所述将所述封面图像转化为输入特征向量的步骤包括:
将所述封面图像进行处理得到图案特征向量;
获取所述封面图像中的文字信息,将所述文字信息进行处理得到文字特征向量;
将所述图案特征向量与所述文字特征向量进行组合得到所述输入特征向量。


3.根据权利要求1至2任一项所述的方法,其特征在于,所述将所述封面图像进行处理得到图案特征向量,进一步包括:
将所述封面图像通过图像向量化模型进行处理得到经过特殊编码的图案像特征向量;
可选地,图像向量化模型为卷积神经网络模型,至少包括VGG模型、resnet模型。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取所述封面图像中的文字信息,将所述文字信息进行处理得到文字特征向量,进一步包括:
使用锚点回归方法对书籍封面图像进行文字检测;
采用循环神经网络对检测到的文字进行识别;
利用词嵌入模型将识别出的文字转化为文字特征向量;
可选地,所述将所述图案特征向量与所述文字特征向量进行组合得到所述输入特征向量,进一步包括:
将处理得到的图案像特征向量及文字特征向量进行向量拼接;
将图案特征向量与文字特征向量首尾拼接得到封面图像转化的输入特征向量;
输入特征向量的维度等于图案像特征向量与文字特征向量维度的总和。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
建立内容数据库,在该内容数据库中存储书籍内容,并为不同书籍的书籍内容分配不同的书籍ID;
将所述内容数据库中的书籍的封面图像转化为特征向量,并为所述特征向量与各书籍ID建立对应关系;
可选地,所述为所述特征向量与各书籍ID建立对应关系的步骤包括:
建立索引数据库存储所述对应关系;
可选地,所述索引数据库和所述内容数据库建立在同一服务器上。


6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
所述服务器获取书籍的封面图像;
将所述封面图像转化为所述输入特征向量;
计算所述输入特征向量与所述索引数据中的特征向量的相似度,根据该相似度确定要获得的目标书籍的书籍ID;

【专利技术属性】
技术研发人员:田宝亮袁景伟王岩程童黄宇飞
申请(专利权)人:小船出海教育科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1