一种诉讼文件的整理方法和装置制造方法及图纸

技术编号:28423543 阅读:11 留言:0更新日期:2021-05-11 18:31
本申请提供一种诉讼文件的整理方法和装置。一种诉讼文件的整理方法,包括:获取待整理的诉讼文件;将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;以案件为单位对所述目标子诉讼文件进行归类整理;其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;所述校验层用于对所述候选子诉讼文件进行内容统一性校验;所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。采用上述方法可以提高诉讼文件的整理效率,提升用户体验。

【技术实现步骤摘要】
一种诉讼文件的整理方法和装置
本申请涉及人工智能领域,特别涉及一种诉讼文件的整理方法和装置。
技术介绍
随着社会的不断发展,人们的维权意识越来越强,法院、律所等需要处理的案件数量也越来越多。相关技术中,工作人员可以将相似的案件进行归纳整合,便于后续执行统一的处理,这样既能遵守同案同判原则,又可以提高案件处理效率。在这一过程中,出于方便,工作人员通常会将这些案件相关的材料打包为一个诉讼文件交付给后续流程,而这一诉讼文件中可能存在多种类型的材料、多个案件的材料,且这些材料可能是杂乱无章的,整理起来十分不便,人工整理效率十分低下。基于此,如何对该诉讼文件进行整理,以提高效率、提升便捷性,成为业内关注的重点。
技术实现思路
有鉴于此,本申请提供一种诉讼文件的整理方法和装置。具体地,本申请是通过如下技术方案实现的:一种诉讼文件的整理方法,所述方法包括:获取待整理的诉讼文件;将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;以案件为单位对所述目标子诉讼文件进行归类整理;其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;所述校验层用于对所述候选子诉讼文件进行内容统一性校验;所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。一种诉讼文件的整理装置,所述装置包括:获取单元,用于获取待整理的诉讼文件;拆分单元,用于将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;整理单元,用于以案件为单位对所述目标子诉讼文件进行归类整理;其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;所述校验层用于对所述候选子诉讼文件进行内容统一性校验;所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。由以上描述可以看出,在本申请的一个实施例中,可以获取待整理的诉讼文件,将所述诉讼文件输入文件拆分模型,以拆分得到若干目标子诉讼文件,然后以案件为单位对目标子诉讼文件进行归类整理。上述过程不需要用户手动操作,可以大大提高诉讼文件整理效率,提升便捷性。并且文件拆分模型可以对拆分得到的子诉讼文件进行内容统一性校验,提高拆分的准确度。附图说明图1是本申请一示例性实施例示出的一种诉讼文件的整理方法的流程示意图;图2是本申请一示例性实施例示出的另一种诉讼文件的整理方法的流程示意图;图3是本申请一示例性实施例示出的一种页面示意图;图4是本申请一示例性实施例示出的一种诉讼文件的整理装置所在服务器的一种硬件结构图;图5是本申请一示例性实施例示出的一种诉讼文件的整理装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。随着社会的不断发展,人们的维权意识越来越强,法院、律所等需要处理的案件数量也越来越多,经常会存在大量的文件被打包成一份诉讼文件的场景,比如,可能会将同一类型的若干案件的材料打包成一份诉讼文件,然后交给负责该类型案件的人员进行后续处理。再比如,也可能在扫描时将同一公司的所有案件相关材料扫描成一个诉讼文件,这个诉讼文件中包括多个案件的起诉状、委托书、证据等等。现有技术中通常由人工对这些包含多案件、多类型材料的诉讼文件进行整理,效率低下,且整理起来十分不便。基于此,本申请提供了一种诉讼文件的整理方法,可以自动地将该诉讼文件拆分为一份份独立的文件,并以案件为单位对拆分后的文件进行整理、归纳,相比于现有技术来说不需要人工操作,可以大大提高效率、提高便捷性。请参见图1,图1是本申请一示例性实施例示出的一种诉讼文件的整理方法的流程示意图,所述方法可以应用于具有存储器、处理器的电子设备上,例如服务器或服务器集群。所述方法可以包括以下步骤:步骤102,获取待整理的诉讼文件。本步骤中,待整理的诉讼文件可以是多种形式的,比如可以是对多个案件的多种类型的文件打包而成的,包括多个案件的起诉状、委托书、证据材料等等。再比如,也可以是相关人员在扫描时将多份文件一起扫描成为一个诉讼文件,如扫描成一个PDF文件。本实施例对诉讼文件中包含的文件类型、文件数量不作特殊限制。步骤104,将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件。本步骤中,可以先对整理的诉讼文件进行预处理,比如可以“页”为最小单位对所述诉讼文件进行拆分,得到若干页,便于文件拆分模型以页为单位进行处理。具体拆分为页的方法可以参照相关技术。当然,上述拆分为页的过程也可以由文件拆分模型来实现,本实施例对此不作特殊限制。本步骤中,可以将拆分为页的诉讼文件输入文件拆分模型,该文件拆分模型可以将诉讼文件拆分为若干目标子诉讼文件,每个目标子诉讼文件为一份独立的、完整的文件,如一份起诉状、一份委托书,或者一份证据,每份文件可以仅包含一页,也可以包含多页,本申请对文件包含的页面数量不作特殊限制。下面结合拆分模型的结构,对拆分模型拆分诉讼文件的方法进行说明。本实施例中,拆分模型可以包括识别层、划分层、校验层和输出层。1、识别层可以先将待整理的诉讼文件输入识别层,识别层可以从该诉讼文件中识别出分隔页,所述分隔页指的是用于划分出一个个独立文件的页面。比如,分隔页可以为首页,首页通常会包括标题,可以据此识别出首页。再比如,分隔页也可以为尾页,尾页的末尾位置可能会存在空白,或者署名,可以据此识别出尾页。当然,除上述例子外,分隔页也可以是其他页面,本实施例在此不一一举例。识别层识别出分隔本文档来自技高网...

【技术保护点】
1.一种诉讼文件的整理方法,其特征在于,所述方法包括:/n获取待整理的诉讼文件;/n将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;/n以案件为单位对所述目标子诉讼文件进行归类整理;/n其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;/n所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;/n所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;/n所述校验层用于对所述候选子诉讼文件进行内容统一性校验;/n所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。/n

【技术特征摘要】
1.一种诉讼文件的整理方法,其特征在于,所述方法包括:
获取待整理的诉讼文件;
将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;
以案件为单位对所述目标子诉讼文件进行归类整理;
其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;
所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;
所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;
所述校验层用于对所述候选子诉讼文件进行内容统一性校验;
所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。


2.根据权利要求1所述方法,其特征在于,所述校验层具体用于:
针对每个候选子诉讼文件,识别出所述候选子诉讼文件中各页面所属的文件类型;
基于所述文件类型对所述候选子诉讼文件进行内容统一性校验。


3.根据权利要求2所述方法,其特征在于,所述校验层在基于所述文件类型对所述候选子诉讼文件进行内容统一性校验时,具体用于:
判断所述候选子诉讼文件中各页面的文件类型是否一致;
若一致,确定所述候选子诉讼文件通过内容统一性校验;
若不一致,确定所述候选子诉讼文件未通过内容统一性校验。


4.根据权利要求1所述方法,其特征在于,所述输出层还用于:
将未校验通过的候选子诉讼文件输出,并输出未校验通过的提醒。


5.根据权利要求1所述方法,其特征在于,所述方法还包括:
对目标子诉讼文件中的各个页面重新进行排序,得到排序后的目标子诉讼文件。


6.根据权利要求5所述方法,其特征在于,所述对所述目标子诉讼文件中的各个页面重新进行排序,包括:
将所述目标子诉讼文件输入排序模型,得到排序后的目标子诉讼文件;
其中,所述排序模型包括布局特征提取层、语义特征提取层、特征融合层和页面排序层;
布局特征提取层用于提取得到所述目标子诉讼文件中各页面的布局特征;
语义特征提取层用于提取得到所述目标子诉讼文件中各页面的语义连贯性特征;
特征融合层用于针对每个页面,将所述页面对应的布局特征和语义连贯性特征进行融合,得到所述页面对应的融合特征;
页面排序层用于基于所述融合特征预测得到所述目标子诉讼文件中各页面的排列位置,并基于所述排列位置输出重新排序后的目标子诉讼文件。


7.根据权利要求6所述方法,其特征在于,所述页面排序层具体用于:
从所述目标子诉讼文件中提取出包括所有页面组合结果的若干页面组合,每个页面组合中包括所述目标子诉讼文件中的任意两个页面;
针对每个页面组合,基于所述页面组合中各页面对应的融合特征,确定所述页面组合中的两个页面是否相邻;
基于相邻的页面组合确定目标子诉讼文件中各页面的排列位置,并基于所述排列位置输出重新排序后的目标子诉讼文件。


8.根据权利要求6所述方法,其特征在于,
所述布局特征包括以下一种或多种:标题特征、段落分布特征、标点符号特征、署名特征;
所述语义连贯性特征包括以下一种或多种:页面末尾文本的实体特征、页面开头文本的实体特征、页面末尾文本的内容相关性特征、页面开头文本的内容相关性特征、页面末尾文本的语法连贯性特征、页面开头文本的语法连贯性特征。


9.根据权利要求2所述方法,其特征在于,所述以案件为单位对所述目标子诉讼文件进行归类整理,包括:
提取出各目标子诉讼文件的案件特征;
基于所述案件特征确定各目标子诉讼文件所属的案件,并将相同案件的目标子诉讼文件进行归类。


10.根据权利要求9所述方法,其特征在于,所述将相同案件的目标子诉讼文件进行归类,包括:
基于案件特征为每个案件建立对应的一级文件夹;
在所述一级文件夹中建立二级文件夹,所述二级文件夹与所述文件类型对应;
将每个目标子诉讼文件归入其所属的二级文件夹。


11.根据权利要求10所述方法,其特征在于,所述案件特征包括以下一种或多种:
原告身份信息、被告身份信息、代理人身份信息、案由信息、案件名称。


12.根据权利要求1所述方法,其特征在于,所述分隔页为首页,所述识别层具体用于:
根据页面的标题特征从所述待整理的诉讼文件中识别出若干首页。


13.一种诉讼文件的整理装置,其特征在于,所述装置包括:
获取单元,用于获取待整理的诉讼文件;
拆分单元,用于将所述待整理的诉讼文件输入文件拆分模型...

【专利技术属性】
技术研发人员:王伟伟王腾飞赵仪琳
申请(专利权)人:共道网络科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1