电子书转换处理方法、装置及计算机可读存储介质制造方法及图纸

技术编号:16176044 阅读:30 留言:0更新日期:2017-09-09 03:18
本公开是关于一种电子书转换处理方法、装置及计算机可读存储介质,所述方法包括:获取目标纸质书的目标图像;对所述目标图像进行图像识别,得到电子文本信息;通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。本公开通过文本结构信息识别,获得目标纸质书的文本结构信息,使得将目标纸质书转换为电子书时,不会丢失其文本结构信息。

【技术实现步骤摘要】
电子书转换处理方法、装置及计算机可读存储介质
本公开涉及电子
,尤其涉及一种电子书转换处理方法、装置及计算机可读存储介质。
技术介绍
近年来文字识别技术不断发展,得到了越来越广泛的应用。对于纸质书,通过拍照、摄影、扫描等方式,可将纸质书转换为图片;然后再通过文字识别,识别出图片中的文字,从而将纸质书转换为电子书。相关技术中,当仅需转换纸质书的部分内容(例如,带标记的内容)为电子书时,得到的电子书为内容片段,内容片段所属的章、节、段落等结构层次信息会丢失。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种电子书转换处理方法、装置及计算机可读存储介质。根据本公开实施例的第一方面,提供一种电子书转换处理方法,包括:获取目标纸质书的目标图像;对所述目标图像进行图像识别,得到电子文本信息;通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。优选地,所述通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息,包括:获取所述电子文本信息对应的文本格式,其中,所述文本格式包括字体、字号、行距、是否加粗和段落格式中的一者或多者;以及根据预设文本结构分类模型和所述文本格式,确定所述电子文本信息的文本结构信息。优选地,在所述根据预设文本结构分类模型和识别出的文字的文本格式,确定所述电子文本信息的文本结构信息之前,所述方法还包括:获取训练样本集,所述训练样本集中包括:所述目标纸质书的图像数据和所述图像数据所对应的文本结构信息;利用训练样本集对卷积神经网络进行训练,获得卷积神经网络的各层参数信息;根据所述各层参数信息构建所述预设文本结构分类模型。优选地,所述方法还包括:获取所述电子文本信息中的笔记部分;将所述笔记部分以及所述笔记部分所对应的文本结构信息关联存储;以及当满足预设条件时,显示所述笔记部分以及所述笔记部分所对应的文本结构信息。根据本公开实施例的第二方面,提供一种电子书转换处理装置,包括:目标图像获取模块,被配置为获取目标纸质书的目标图像;电子文本信息获取模块,被配置为对所述目标图像进行图像识别,得到电子文本信息;结构信息确定模块,被配置为通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;电子书生成模块,被配置为根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。优选地,所述结构信息确定模块包括:文本格式获取子模块,被配置为获取所述电子文本信息对应的文本格式,其中,所述文本格式包括字体、字号、行距、是否加粗和段落格式中的一者或多者;以及结构信息确定子模块,被配置为根据预设文本结构分类模型和所述文本格式,确定所述电子文本信息的文本结构信息。优选地,所述装置还包括:训练样本集获取模块,被配置为获取训练样本集,所述训练样本集中包括:所述目标纸质书的图像数据和所述图像数据所对应的文本结构信息;参数信息获取模块,被配置为利用训练样本集对卷积神经网络进行训练,获得卷积神经网络的各层参数信息;预设分类模型构建模块,被配置为根据所述各层参数信息构建所述预设文本结构分类模型。优选地,所述装置还包括:笔记获取模块,被配置为获取所述电子文本信息中的笔记部分;存储模块,被配置为将所述笔记部分以及所述笔记部分所对应的文本结构信息关联存储;以及显示模块,被配置为在满足预设条件时,显示所述笔记部分以及所述笔记部分所对应的文本结构信息。根据本公开实施例的第三方面,提供一种电子书转换处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取目标纸质书的目标图像;对所述目标图像进行图像识别,得到电子文本信息;通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的电子书转换处理方法的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:在将目标纸质书转换为电子书时,可保留文本结构信息,使得将纸质书转换为电子书时,不会丢失其结构层次信息;且无需进行人工转换。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种电子书转换处理方法的流程图。图2是本公开一实施例中获取文本结构信息的流程示意图。图3是本公开的一实施例中,当目标图像中的文字均属于正文文本时的处理流程示意图。图4是本公开一实施例进行训练获得预设文本结构分类模型的流程示意图。图5是本公开一实施例对训练好的预设文本结构分类模型进行测试的流程示意图。图6是本公开一实施例中对笔记部分进行电子书转换的流程示意图。图7是本公开一实施例的对笔记部分和笔记部分所对应的文件结构信息进行显示的效果示意图。图8是根据一示例性实施例示出的一种电子书转换处理装置的框图。图9是根据一示例性实施例示出的一种用于电子书转换处理方法的装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种电子书转换处理方法的流程图,如图1所示,该电子书转换处理方法用于终端中,包括以下步骤:在步骤S11中,获取目标纸质书的目标图像。目标图像可包括正文图像和笔记图像。用户阅读纸质书时,可在纸质书上通过划线、图形标注、手写笔记等做笔记。当需要将纸质书的某些部分(例如,带标记的字、词、句子、段落或章节等)转换为电子书时,通过图像采集装置对包含目标纸质书进行图像采集,获得目标图像。在本公开的实施例中,图像采集装置可为相机、扫描仪、手机等。对目标纸质书进行图像采集,即通过图像采集装置对目标纸质书进行拍摄或扫描,得到目标图像。在步骤S12中,对目标图像进行图像识别,得到电子文本信息。通过对目标图像进行图像识别,识别目标图像中的文字,得到电子文本信息,电子文本信息至少包括文字及文字的文本格式。文本格式包括字体、字号、行距、是否加粗和段落格式中的一者或多者。在本公开的一实施例中,可通过对目标图像进行预处理(例如,对目标图像进行灰度化、降噪、二值化、字符切分以及归一化等等),以及对预处理后的目标图像进行特征提取和降维处理后,进行文字识别和文本格式识别。在一个实施例中,为了提高文字识别的准确率,获得文字识别结果后,再对文字识别结果进行优化,以对文字识别结果进行校正。对文字识别结果进行校正可通过语言模型来进行校正,以纠正识别错误的文字。在步骤S13中,通过分析电子文本信息,确定电子文本信息的文本结构信息。文本结构信息至少包括以下信息中的一者或多者:所属部分、所属章、所属节和所属页。参见图2,在本公开的一实施例中,通过以下方式获本文档来自技高网...
电子书转换处理方法、装置及计算机可读存储介质

【技术保护点】
一种电子书转换处理方法,其特征在于,包括:获取目标纸质书的目标图像;对所述目标图像进行图像识别,得到电子文本信息;通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。

【技术特征摘要】
1.一种电子书转换处理方法,其特征在于,包括:获取目标纸质书的目标图像;对所述目标图像进行图像识别,得到电子文本信息;通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;根据所述电子文本信息和所述文本结构信息,生成针对所述目标纸质书的电子书。2.根据权利要求1所述的方法,其特征在于,所述通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息,包括:获取所述电子文本信息对应的文本格式,其中,所述文本格式包括字体、字号、行距、是否加粗和段落格式中的一者或多者;以及根据预设文本结构分类模型和所述文本格式,确定所述电子文本信息的文本结构信息。3.根据权利要求2所述的方法,其特征在于,在所述根据预设文本结构分类模型和识别出的文字的文本格式,确定所述电子文本信息的文本结构信息之前,所述方法还包括:获取训练样本集,所述训练样本集中包括:所述目标纸质书的图像数据和所述图像数据所对应的文本结构信息;利用训练样本集对卷积神经网络进行训练,获得卷积神经网络的各层参数信息;根据所述各层参数信息构建所述预设文本结构分类模型。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述电子文本信息中的笔记部分;将所述笔记部分以及所述笔记部分所对应的文本结构信息关联存储;以及当满足预设条件时,显示所述笔记部分以及所述笔记部分所对应的文本结构信息。5.一种电子书转换处理装置,其特征在于,包括:目标图像获取模块,被配置为获取目标纸质书的目标图像;电子文本信息获取模块,被配置为对所述目标图像进行图像识别,得到电子文本信息;结构信息确定模块,被配置为通过分析所述电子文本信息,确定所述电子文本信息的文本结构信息;电子书生成模块,被配置为根据所述电子文本...

【专利技术属性】
技术研发人员:高蕾
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1