【技术实现步骤摘要】
案件文书排序方法及相关设备
本说明书一个或多个实施例涉及文本处理
,尤其涉及一种案件文书排序方法及相关设备。
技术介绍
随着人工智能在法律领域的应用,电子卷宗已经成为了司法领域智慧化建设的前提和基础。建立高质量、可视化、精细化的电子卷宗也是未来电子卷宗深度应用的前提。以往,电子卷宗编目需要编目人员从纸质案件文书中手动提取文件名称,对文书进行分类、排序等操作。这种排序方式费时费力,并且很有可能造成案件文书页顺序被打乱,最终以乱序状态存放的情况。电子卷宗智能编目系统可以将上述过程交给机器自动处理。案件文书利用扫描仪生成图像后,通过图文识别、自然语言处理等人工智能技术,使电子卷宗智能编目系统能够在后台自动将电子文件区分成一份一份独立的文书,并提取出其标题和重要信息等,进而生成结构化的文档。对于同一份文书,还需要对多页文书进行顺序检查,对于打乱顺序的文书页需要进行重排。文书排序系统作为电子卷宗智能编目的一部分起着至关重要的作用。目前,司法案件文书种类繁多且新类型诉讼材料不断出现,由于人工智能领域可用于文书自动排序的相关 ...
【技术保护点】
1.一种案件文书排序方法,其特征在于,包括:/n基于现有案件文书信息定义文书页的结尾类型和开头类型;/n基于所述结尾类型和所述开头类型生成排序分类模板,并根据排序分类模板构建相应排序算法;/n通过文本检测模型对所述文书页进行首页识别得到文书首页;/n基于所述结尾类型和所述开头类型对所述文书页进行分类,将经过分类的所述文书页组成文书页集合,选取所述文书页集合中的任一元素作为当前文书页,基于所述排序分类模板确定所述当前文书页和所述文书页集合中的任一剩余文书页对应的排序算法并计算相关度,将相关度较高的所述剩余文书页作为所述当前文书页的下页文书候选集,将所述下页文书候选集中的任一元 ...
【技术特征摘要】
1.一种案件文书排序方法,其特征在于,包括:
基于现有案件文书信息定义文书页的结尾类型和开头类型;
基于所述结尾类型和所述开头类型生成排序分类模板,并根据排序分类模板构建相应排序算法;
通过文本检测模型对所述文书页进行首页识别得到文书首页;
基于所述结尾类型和所述开头类型对所述文书页进行分类,将经过分类的所述文书页组成文书页集合,选取所述文书页集合中的任一元素作为当前文书页,基于所述排序分类模板确定所述当前文书页和所述文书页集合中的任一剩余文书页对应的排序算法并计算相关度,将相关度较高的所述剩余文书页作为所述当前文书页的下页文书候选集,将所述下页文书候选集中的任一元素作为新的当前文书页并依照相关排序算法进行迭代计算,直至得到最后一页文书页则迭代结束,输出包含有所述文书首页的至少一种文书排序序列。
2.根据权利要求1所述的方法,其特征在于,所述结尾类型包括标题、整段、段中整句和句子前半句。
3.根据权利要求1或2所述的方法,其特征在于,所述开头类型包括标题、整段、段中整句和句子后半句。
4.根据权利要求1或2所述的方法,其特征在于,所述基于现有案件文书信息定义文书页的结尾类型和开头类型,还包括通过光学字符识别OCR识别软件对所述文书页进行标题编号抽取。
5.根据权利要求1或2所述的方法,其特征在于,所述基于所述结尾类型和所述开头类型生成排序分类模板,包括首先确定所述结尾类型,根据结尾类型排除不可能与之相连的所述开头类型,保留能够与之相连的所述开头类型,将所述结尾类型与能够与之相连的所述开头类型进行匹配形成分类模板。
6.根据权利要求1或2所述的方法,其特...
【专利技术属性】
技术研发人员:朵思惟,余梓飞,张艳丽,王斐,
申请(专利权)人:天津汇智星源信息技术有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。