【技术实现步骤摘要】
本公开实施例涉及计算机,尤其涉及书籍数据处理方法、装置、设备及存储介质。
技术介绍
1、书籍一般指装订成册的图书,为了方便读者查看,可以将一些类型的书籍进行电子化。以古籍为例,古籍,是指未采用现代印刷技术印制的书籍。古籍数字化是指利用现代信息技术对古籍文献进行加工处理,使其转化为电子数据形式,通过光盘、网络等介质保存和传播。
2、目前,采用人工智能相关技术,可以将书籍对应的图片等数据转化成可阅读数据。然而,现有算法识别的直接产物只具备基础的可读性,仍然需要耗费大量的人力进行精细的校对工作,工作效率低下。
技术实现思路
1、本公开实施例提供了书籍数据处理方法、装置、存储介质及设备,可以实现针对书籍的自动校对。
2、第一方面,本公开实施例提供了书籍数据处理方法,包括:
3、确定目标书籍对应的底本数据、校本数据以及目标校对场景;
4、根据所述目标校对场景确定对应的目标组件配置信息,其中,所述目标组件配置信息中包括待调用的目标校对组件的标识信息,不同
...【技术保护点】
1.一种书籍数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定目标书籍对应的底本数据、校本数据以及校对场景,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标校对场景包括文字校对场景;其中,所述基于所述目标组件配置信息调用所述目标校对组件,以通过所述目标校对组件对所述底本数据和所述校本数据进行匹配处理,包括:
4.根据权利要求1所述的方法,其特征在于,所述目标校对场景包括文字精校场景;其中,所述基于所述目标组件配置信息调用所述目标校对组件,以通过所述目标校对组件对所述底本数据和所述校本数据进
...【技术特征摘要】
1.一种书籍数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述确定目标书籍对应的底本数据、校本数据以及校对场景,包括:
3.根据权利要求1所述的方法,其特征在于,所述目标校对场景包括文字校对场景;其中,所述基于所述目标组件配置信息调用所述目标校对组件,以通过所述目标校对组件对所述底本数据和所述校本数据进行匹配处理,包括:
4.根据权利要求1所述的方法,其特征在于,所述目标校对场景包括文字精校场景;其中,所述基于所述目标组件配置信息调用所述目标校对组件,以通过所述目标校对组件对所述底本数据和所述校本数据进行匹配处理,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标组件配置信息调用文字匹配器,以利用所述文字匹配器中的第二预设匹配算法,对所述底本数据和所述校本数据进行基于段落的第二匹配处理,包括:
6.根据权利要求1所述的方法,其特征在于,所述目标校对场景包括标点校对场景;其中,所述基于所述目标组件配置信息调用所述目标校对组件,以通过所述目标校对组件对所述底本数据和所述校本数据进行匹配处理,包括:
7.根据权利要求1所述的方法,其特征在于,所述目标书籍包括目标古籍,在所述通过所述目标校对组件对所述底本数据和所述校本数据进行匹配的过程中,去除预设古籍字符,其中,所述预设古籍字符包括字...
【专利技术属性】
技术研发人员:梁全欢,杨斌,赵明强,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。