信息回填方法及其相关电子设备、存储介质技术

技术编号:28454766 阅读:20 留言:0更新日期:2021-05-15 21:18
本申请公开了一种信息回填方法及其相关电子设备、存储介质。其中,信息回填方法包括:获取多个待抽取文件;分别对多个待抽取文件进行要素抽取,得到包括至少一组标签抽取结果的要素抽取结果;从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个抽取要素;将选出的抽取要素作为目标文件的目标标签的回填信息。由于每组标签抽取结果包括的若干个抽取要素对应于相同标签且分别从不同待抽取文件抽取得到的,因此,可以从不同待抽取文件中选择内容作为目标文件的回填内容,并且无需人工筛选待抽取文件后手动填写目标文件,从而能够节省人力,提高信息回填的效率。提高信息回填的效率。提高信息回填的效率。

【技术实现步骤摘要】
信息回填方法及其相关电子设备、存储介质


[0001]本申请涉及信息
,特别是涉及一种信息回填方法及其相关电子设备、存储介质。

技术介绍

[0002]相关机构在案件的不同阶段会产生不同类型的文件,但是同一案件中,姓名、身份证号码等信息是可以共用的,因此,可以从已有的文件中得到部分内容,直接应用于后续文件中。一般地,在从已有文件中获取这些可以共用的信息时,需要人工阅读已有文件找对对应内容,然后手动填写到目标文件中,耗费大量时间和人力。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种信息回填方法及其相关电子设备、存储介质,能够节省人力,提高信息回填的效率。
[0004]为了解决上述问题,本申请第一方面提供了一种信息回填方法,所述方法包括:获取多个待抽取文件;分别对所述多个待抽取文件进行要素抽取,得到要素抽取结果,其中,所述要素抽取结果包括至少一组标签抽取结果,每组所述标签抽取结果包括对应相同标签的若干个抽取要素,对应相同标签的不同所述抽取要素是分别从不同所述待抽取文件抽取得到的;从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素;将选出的所述抽取要素作为所述目标文件的目标标签的回填信息。
[0005]其中,每组所述标签抽取结果还包括分别与所述若干抽取要素对应的若干抽取标记,所述抽取标记包括标签名称,每组所述标签抽取结果中的若干所述标签名称均指向同一所述标签;在所述从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素之前,所述方法还包括:选出所包含的所述标签名称与所述目标标签匹配的一组标签抽取结果,作为与所述目标标签匹配的一组标签抽取结果。
[0006]其中,所述标签名称包括以下至少一种:文书文号、文书日期、住所地、当事人信息。
[0007]其中,每组所述标签抽取结果还包括分别与所述若干抽取要素对应的若干抽取标记,所述抽取标记包括对应的所述抽取要素所来自的所述待抽取文件的文件类型;所述从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素,包括:按照所述文件类型的优先级,依序将与目标标签匹配的一组标签抽取结果中的每个所述抽取要素作为候选抽取要素;判断所述候选抽取要素是否为空;若否,则将所述候选抽取要素作为选出的抽取要素,并执行所述将选出的所述抽取要素作为所述目标文件的目标标签的回填信息。
[0008]其中,所述将选出的所述抽取要素作为所述目标文件的目标标签的回填信息,包括:对所述选出的所述抽取要素进行格式处理,得到标准要素,其中,所述格式处理包括以下至少一种:转换成匹配的预设枚举要素、日期格式转化、数字转化;将所述标准要素作为
所述目标文件的目标标签的回填信息。
[0009]其中,在所述对所述选出的所述抽取要素进行格式处理,得到标准要素之后,所述方法还包括:判断所述标准要素是否满足所述目标标签的回填要求;若否,则从与目标文件的目标标签匹配的一组标签抽取结果中,剔除所述不满足所述回填要求的所述抽取要素,并重新执行所述从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素及其后续步骤,直到选出的所述抽取要素对应的所述标准要素满足所述回填要求,再执行所述将所述标准要素作为所述目标文件的目标标签的回填信息。
[0010]其中,每组所述标签抽取结果还包括分别与所述若干抽取要素对应若干位置信息,所述位置信息用于索引对应的所述抽取要素在所述待抽取文件中的位置;所述将选出的所述抽取要素作为所述目标文件的目标标签的回填信息之后,所述方法还包括:响应于用户对所述回填信息的查阅指令,获取作为所述回填信息的所述抽取要素对应的所述位置信息;显示所述获取的位置信息所指向的所述待抽取文件的相应页面。
[0011]其中,在所述显示所述获取的位置信息所指向的所述待抽取文件的相应页面之后,所述方法还包括:在显示的页面上,标记出被抽取作为所述回填信息的内容;和/或,获取用户对所述回填信息的修改内容,将所述修改内容作为所述所述目标文件的目标标签的最终回填信息。
[0012]其中,所述要素抽取结果是利用文件抽取引擎对所述多个待抽取文件进行要素抽取得到的;所述将所述修改内容作为所述所述目标文件的目标标签的最终回填信息之后,所述方法还包括:将回填有所述最终回填信息的所述目标文件作为所述文件抽取引擎的训练样本。
[0013]其中,所述获取多个待抽取文件包括:获取多个原始电子文件;识别所述原始电子文件的文件类型;基于所述文件类型,筛选出预设文件类型的所述原始电子文件作为所述待抽取文件;在所述分别对所述多个待抽取文件进行要素抽取,得到要素抽取结果之前,所述方法还包括:利用文字识别算法将所述待抽取文件转化为文本格式。
[0014]为解决上述问题,本申请第二方面提供了一种电子设备,包括:相互耦接的存储器和处理器;处理器用于执行存储器存储的程序指令,以实现上述第一方面的信息回填方法。
[0015]为解决上述问题,本申请第三方面提供了一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现上述第一方面的信息回填方法。
[0016]通过上述方式,分别对多个待抽取文件进行要素抽取后,得到包括至少一组标签抽取结果的要素抽取结果,由于每组标签抽取结果包括的若干个抽取要素对应于相同标签且分别从不同待抽取文件抽取得到的,因此,从一组标签抽取结果中,选出一个或多个所述抽取要素作为回填信息时,可以从不同待抽取文件中选择内容作为目标文件的回填内容,无需人工筛选待抽取文件后手动填写目标文件,从而节省人力,提高信息回填的效率。
附图说明
[0017]图1是本申请信息回填方法一实施例的流程示意图;
[0018]图2是本申请信息回填方法另一实施例的流程示意图;
[0019]图3是本申请信息回填方法再一实施例的流程示意图;
[0020]图4是本申请电子设备一实施例的框架示意图;
[0021]图5是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0023]请参阅图1,图1是本申请信息回填方法一实施例的流程示意图。
[0024]具体而言,本实施例方法包括以下步骤:
[0025]步骤S11:获取多个待抽取文件。
[0026]待抽取文件可用于提供回填信息的相关内容。由于不同文件之间可能包括相同的内容,因此可以将已有文件作为待抽取文件,而待填写的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息回填方法,其特征在于,所述方法包括:获取多个待抽取文件;分别对所述多个待抽取文件进行要素抽取,得到要素抽取结果,其中,所述要素抽取结果包括至少一组标签抽取结果,每组所述标签抽取结果包括对应相同标签的若干个抽取要素,对应相同标签的不同所述抽取要素是分别从不同所述待抽取文件抽取得到的;从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素;将选出的所述抽取要素作为所述目标文件的目标标签的回填信息。2.根据权利要求1所述的方法,其特征在于,每组所述标签抽取结果还包括分别与所述若干抽取要素对应的若干抽取标记,所述抽取标记包括标签名称,每组所述标签抽取结果中的若干所述标签名称均指向同一所述标签;在所述从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素之前,所述方法还包括:选出所包含的所述标签名称与所述目标标签匹配的一组标签抽取结果,作为与所述目标标签匹配的一组标签抽取结果。3.根据权利要求2所述的方法,其特征在于,所述标签名称包括以下至少一种:文书文号、文书日期、住所地、当事人信息。4.根据权利要求1所述的方法,其特征在于,每组所述标签抽取结果还包括分别与所述若干抽取要素对应的若干抽取标记,所述抽取标记包括对应的所述抽取要素所来自的所述待抽取文件的文件类型;所述从与目标文件的目标标签匹配的一组标签抽取结果中,选出一个或多个所述抽取要素,包括:按照所述文件类型的优先级,依序将与目标标签匹配的一组标签抽取结果中的每个所述抽取要素作为候选抽取要素;判断所述候选抽取要素是否为空;若否,则将所述候选抽取要素作为选出的抽取要素,并执行所述将选出的所述抽取要素作为所述目标文件的目标标签的回填信息。5.根据权利要求1所述的方法,其特征在于,所述将选出的所述抽取要素作为所述目标文件的目标标签的回填信息,包括:对所述选出的所述抽取要素进行格式处理,得到标准要素,其中,所述格式处理包括以下至少一种:转换成匹配的预设枚举要素、日期格式转化、数字转化;将所述标准要素作为所述目标文件的目标标签的回填信息。6.根据权利要求5所述的方法,其特征在于,在所述对所述选出的所述抽取要素进行格式处理,得到标准要素之后,所述方法还包括:判断所述标准要素是否满足所述目标标签的回填要...

【专利技术属性】
技术研发人员:徐美君昕宇昌玮路姚
申请(专利权)人:讯飞智元信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1