出版物模板构建方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:24854710 阅读:21 留言:0更新日期:2020-07-10 19:08
本发明专利技术提供一种出版物模板构建方法、装置、设备及计算机可读存储介质,方法包括:通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;根据各与所述待处理区块中对应的数据形成所述出版物模板。从而能够自动地实现对出版物模板的制作,从而能够提高出版物模板的制作效率与准确度,进而能够节约人力物力。

【技术实现步骤摘要】
出版物模板构建方法、装置、设备及计算机可读存储介质
本专利技术涉及数字出版领域,尤其涉及一种出版物模板构建方法、装置、设备及计算机可读存储介质。
技术介绍
目前出版刊物的模板制作分为两种形式:通过人眼识别刊物已有PDF文件,提炼出构建模板需要的数据信息,如段落样式、字体、字号、页眉页脚数据等,从零开始编写全新的模板文件;通过人眼识别刊物已有PDF文件,提炼出构建模板需要的数据信息,如段落样式、字体、字号、页眉页脚数据等,在原有的相对大而全的模板文件基础上进行修改生成新的模板文件。但是,上述两种出版刊物模板制作的方法不仅对于制作人员的前期培训成本大,而且即使熟练的模板制作人员也容易犯一些低级的错误,造成模板制作的准确率不高。此外,通过人眼识别PDF中相关信息并转化为模板数据信息的过程繁琐,费时费力。
技术实现思路
本专利技术提供一种出版物模板构建方法、装置、设备及计算机可读存储介质,用于解决现有的出版物模板制作方法准确率较低,且效率较低的技术问题。本专利技术的第一个方面是提供一种出版物模板构建方法,包括:通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;根据各与所述待处理区块中对应的数据形成所述出版物模板。本专利技术的另一个方面是提供一种出版物模板构建装置,包括:解析模块,用于通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;分割模块,用于按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;选择模块,用于分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;组合模块,用于根据各与所述待处理区块中对应的数据形成所述出版物模板。本专利技术的又一个方面是提供一种出版物模板构建设备,包括:存储器,处理器;存储器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为由所述处理器执行如上述的出版物模板构建方法。本专利技术的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的出版物模板构建方法。本专利技术提供的出版物模板构建方法、装置、设备及计算机可读存储介质,通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;根据各与所述待处理区块中对应的数据形成所述出版物模板。从而能够自动地实现对出版物模板的制作,从而能够提高出版物模板的制作效率与准确度,进而能够节约人力物力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的出版物模板制作方法的流程示意图;图2为本专利技术实施例二提供的出版物模板构建方法的流程示意图;图3为本专利技术实施例三提供的出版物模板构建方法的流程示意图;图4为本专利技术实施例四提供的出版物模板构建方法的流程示意图;图5为本专利技术实施例五提供的出版物模板构建方法的流程示意图;图6为本专利技术实施例六提供的出版物模板制作装置的结构示意图;图7为本专利技术实施例七提供的出版物模板构建设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例所获得的所有其他实施例,都属于本专利技术保护的范围。目前出版刊物的模板制作分为两种形式:通过人眼识别刊物已有PDF文件,提炼出构建模板需要的数据信息,如段落样式、字体、字号、页眉页脚数据等,从零开始编写全新的模板文件;通过人眼识别刊物已有PDF文件,提炼出构建模板需要的数据信息,如段落样式、字体、字号、页眉页脚数据等,在原有的相对大而全的模板文件基础上进行修改生成新的模板文件。但是,上述两种出版刊物模板制作的方法不仅对于制作人员的前期培训成本大,而且即使熟练的模板制作人员也容易犯一些低级的错误,造成模板制作的准确率不高。此外,通过人眼识别PDF中相关信息并转化为模板数据信息的过程繁琐,费时费力。为了解决上述技术问题,本专利技术提供了一种出版物模板构建方法、装置、设备及计算机可读存储介质。需要说明的是,本申请提供出版物模板构建方法、装置、设备及计算机可读存储介质可运用在任意一种模板制作的场景中。图1为本专利技术实施例一提供的出版物模板制作方法的流程示意图,如图1所示,所述出版物模板制作方法包括:步骤101、通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据。本实施例的执行主体为出版物模板制作装置,该出版物制作装置可以有软件和/或硬件实现,当其采用软件实现时,可以采用C/C++、Java、Shell或Python等语言编写。为了实现对出版物模板的制作,首先可以待解析文件进行解析,其中,待解析文件可以为已有出版物中的PDF文件、已有出版物的图像信息等。区别于现有技术中通过人工对已有出版物中的PDF文件进行识别,通过预设的解析方法对该已有出版物中的PDF文件进行识别能够大大地提高识别效率以及识别精准度。对待解析文件进行解析之后,能够获得与待解析文件对应的原始数据,其中,该原始数据即为待解析文件中的具体内容。步骤102、按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块。在本实施方式中,由于待解析文件中内容较多,因此,直接根据待解析文件对应的原始数据进行模板制作往往会制作效率较低。为了进一步地提高出版物模板制作效率,在对待解析文件进行解析,获得与待解析文件对应的原始数据之后,可以对原始数据进行分割,分割为多个部分,对每个部分进行处理。具体地,可以采用预设的分割模板对原始数据进行分割,获得至少一个待处理区块。步骤103、分别从预设的模板数据库中选择与各所述待处理区块中对应的数据。在本实施方式中,采用预设的分割模板对原始数据进行分割,获得至少一个待处理区块,为了实现对出版物模板的制作,可以根据该待处理区块,从预设的模板数据库中选择与该待处理区块对应的数据。其中,模板数据库中存储有当前全部的模板数据,包括采用预设的分割模板对原始数据进行分割,获得至少一个待处理区块字体、字号、行距、不同的线条信息等。由于待处理区块的数量为至少一个,为了保证数据完整性,需要分别从预设的模板数据库中选择与各待处理区块中对应的数据。步骤104、本文档来自技高网...

【技术保护点】
1.一种出版物模板构建方法,其特征在于,包括:/n通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;/n按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;/n分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;/n根据各与所述待处理区块中对应的数据形成所述出版物模板。/n

【技术特征摘要】
1.一种出版物模板构建方法,其特征在于,包括:
通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据;
按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块;
分别从预设的模板数据库中选择与各所述待处理区块中对应的数据;
根据各与所述待处理区块中对应的数据形成所述出版物模板。


2.根据权利要求1所述的方法,其特征在于,所述通过预设的解析方法对待解析文件进行解析,获得与所述待解析文件对应的原始数据,包括:
通过预设的机器学习和/或图像识别和/或OCR文字识别对待解析文件进行解析,获得与所述待解析文件对应的原始数据。


3.根据权利要求1所述的方法,其特征在于,所述按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块,包括:
将所述原始数据划分为至少一个页面;
针对每个页面,通过预设的分割模板对所述页面进行分割,获得至少一个待处理区块。


4.根据权利要求1所述的方法,其特征在于,所述按照预设的分割模板对所述原始数据进行分割,获得至少一个待处理区块,包括:
按照预设的分割模板将所述原始数据分割为边界区块与核心区块,所述边界区块包括上边界区块、下边界区块、左边界区块以及右边界区块,所述核心区块为版心区域。


5.根据权利要求1-4任一项所述的方法,其特征在于,所述待处理区块中包括线条数据与文字数据;
相应地,所述分别从预设的模板数据库中选择与各所述待处理区块中对应的数据,包括:

【专利技术属性】
技术研发人员:上官致伟王婷谢建平
申请(专利权)人:北大方正集团有限公司北大方正信息产业集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1