【技术实现步骤摘要】
一种诉讼文件的整理方法和装置
本申请涉及人工智能领域,特别涉及一种诉讼文件的整理方法和装置。
技术介绍
随着社会的不断发展,人们的维权意识越来越强,法院、律所等需要处理的案件数量也越来越多。相关技术中,工作人员可以将相似的案件进行归纳整合,便于后续执行统一的处理,这样既能遵守同案同判原则,又可以提高案件处理效率。在这一过程中,出于方便,工作人员通常会将这些案件相关的材料打包为一个诉讼文件交付给后续流程,而这一诉讼文件中可能存在多种类型的材料、多个案件的材料,且这些材料可能是杂乱无章的,整理起来十分不便,人工整理效率十分低下。基于此,如何对该诉讼文件进行整理,以提高效率、提升便捷性,成为业内关注的重点。
技术实现思路
有鉴于此,本申请提供一种诉讼文件的整理方法和装置。具体地,本申请是通过如下技术方案实现的:一种诉讼文件的整理方法,所述方法包括:获取待整理的诉讼文件;将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;以案件为单位对所述目标子诉讼文件进行归类整理;其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;所述校验层用于对所述候选子诉讼文件进行内容统一性校验;所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。一种诉讼文件的整理装置,所 ...
【技术保护点】
1.一种诉讼文件的整理方法,其特征在于,所述方法包括:/n获取待整理的诉讼文件;/n将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;/n以案件为单位对所述目标子诉讼文件进行归类整理;/n其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;/n所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;/n所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;/n所述校验层用于对所述候选子诉讼文件进行内容统一性校验;/n所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。/n
【技术特征摘要】
1.一种诉讼文件的整理方法,其特征在于,所述方法包括:
获取待整理的诉讼文件;
将所述待整理的诉讼文件输入文件拆分模型,得到拆分后的若干目标子诉讼文件;
以案件为单位对所述目标子诉讼文件进行归类整理;
其中,所述文件拆分模型包括识别层、划分层、校验层和输出层;
所述识别层用于从所述待整理的诉讼文件中识别出若干分隔页;
所述划分层用于基于所述分隔页将所述待整理的诉讼文件划分为若干候选子诉讼文件;
所述校验层用于对所述候选子诉讼文件进行内容统一性校验;
所述输出层用于将校验通过的候选子诉讼文件确定为目标子诉讼文件并输出。
2.根据权利要求1所述方法,其特征在于,所述校验层具体用于:
针对每个候选子诉讼文件,识别出所述候选子诉讼文件中各页面所属的文件类型;
基于所述文件类型对所述候选子诉讼文件进行内容统一性校验。
3.根据权利要求2所述方法,其特征在于,所述校验层在基于所述文件类型对所述候选子诉讼文件进行内容统一性校验时,具体用于:
判断所述候选子诉讼文件中各页面的文件类型是否一致;
若一致,确定所述候选子诉讼文件通过内容统一性校验;
若不一致,确定所述候选子诉讼文件未通过内容统一性校验。
4.根据权利要求1所述方法,其特征在于,所述输出层还用于:
将未校验通过的候选子诉讼文件输出,并输出未校验通过的提醒。
5.根据权利要求1所述方法,其特征在于,所述方法还包括:
对目标子诉讼文件中的各个页面重新进行排序,得到排序后的目标子诉讼文件。
6.根据权利要求5所述方法,其特征在于,所述对所述目标子诉讼文件中的各个页面重新进行排序,包括:
将所述目标子诉讼文件输入排序模型,得到排序后的目标子诉讼文件;
其中,所述排序模型包括布局特征提取层、语义特征提取层、特征融合层和页面排序层;
布局特征提取层用于提取得到所述目标子诉讼文件中各页面的布局特征;
语义特征提取层用于提取得到所述目标子诉讼文件中各页面的语义连贯性特征;
特征融合层用于针对每个页面,将所述页面对应的布局特征和语义连贯性特征进行融合,得到所述页面对应的融合特征;
页面排序层用于基于所述融合特征预测得到所述目标子诉讼文件中各页面的排列位置,并基于所述排列位置输出重新排序后的目标子诉讼文件。
7.根据权利要求6所述方法,其特征在于,所述页面排序层具体用于:
从所述目标子诉讼文件中提取出包括所有页面组合结果的若干页面组合,每个页面组合中包括所述目标子诉讼文件中的任意两个页面;
针对每个页面组合,基于所述页面组合中各页面对应的融合特征,确定所述页面组合中的两个页面是否相邻;
基于相邻的页面组合确定目标子诉讼文件中各页面的排列位置,并基于所述排列位置输出重新排序后的目标子诉讼文件。
8.根据权利要求6所述方法,其特征在于,
所述布局特征包括以下一种或多种:标题特征、段落分布特征、标点符号特征、署名特征;
所述语义连贯性特征包括以下一种或多种:页面末尾文本的实体特征、页面开头文本的实体特征、页面末尾文本的内容相关性特征、页面开头文本的内容相关性特征、页面末尾文本的语法连贯性特征、页面开头文本的语法连贯性特征。
9.根据权利要求2所述方法,其特征在于,所述以案件为单位对所述目标子诉讼文件进行归类整理,包括:
提取出各目标子诉讼文件的案件特征;
基于所述案件特征确定各目标子诉讼文件所属的案件,并将相同案件的目标子诉讼文件进行归类。
10.根据权利要求9所述方法,其特征在于,所述将相同案件的目标子诉讼文件进行归类,包括:
基于案件特征为每个案件建立对应的一级文件夹;
在所述一级文件夹中建立二级文件夹,所述二级文件夹与所述文件类型对应;
将每个目标子诉讼文件归入其所属的二级文件夹。
11.根据权利要求10所述方法,其特征在于,所述案件特征包括以下一种或多种:
原告身份信息、被告身份信息、代理人身份信息、案由信息、案件名称。
12.根据权利要求1所述方法,其特征在于,所述分隔页为首页,所述识别层具体用于:
根据页面的标题特征从所述待整理的诉讼文件中识别出若干首页。
13.一种诉讼文件的整理装置,其特征在于,所述装置包括:
获取单元,用于获取待整理的诉讼文件;
拆分单元,用于将所述待整理的诉讼文件输入文件拆分模型...
【专利技术属性】
技术研发人员:王伟伟,王腾飞,赵仪琳,
申请(专利权)人:共道网络科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。