司法文书信息提取和关联展示方法、装置及存储介质制造方法及图纸

技术编号:27936762 阅读:100 留言:0更新日期:2021-04-02 14:17
本发明专利技术涉及自然语言处理中的实体识别技术领域,一种司法文书信息提取和关联展示方法、装置及存储介质。其中方法,包括利用实体识别规则分别从司法文书的每个犯罪事实中识别抽取出对应的实体集合,利用轴生成规则将实体集合进行时间轴展示,利用关联规则实现时间轴与司法文书之间的关联展示。本发明专利技术采用的实体识别技术,能够准确的获取犯罪事实的属性信息,并采用时间轴对实体集合进行更直观的展示,此外,采用关联展示方法增强关联交互,实现了信息的定位关联。本发明专利技术不仅保证了获取信息的准确性,简化了获取信息步骤,还辅助办案人员提高了办案效率。

【技术实现步骤摘要】
司法文书信息提取和关联展示方法、装置及存储介质
本专利技术涉及自然语言处理
中的实体识别技术,具体涉及一种司法文书信息提取和关联展示方法。此外,本申请还涉及一种司法文书信息提取和关联展示装置,以及一种计算机可读存储介质。
技术介绍
司法文书是指公安机关和法院、检察院等政法机关在办理案件时使用的具有特定结构和一定效力的文书,例如公安机关制作的《起诉意见书》《询问/讯问笔录》侦查文书以及检察院制作的《起诉书》检察文书。这些司法文书中包含许多重要的关键信息,例如《起诉意见书》中经侦查查明的内容中包含许多段犯罪事实,这些犯罪事实又包含许多时间、地点和人物多种法律的实体属性信息等,为了能够辅助办案人员直观获悉司法文书中的重要要素,提高办案效率,首先,可以使用自然语言处理技术从这些文书中提取出信息,然后,再通过直观的表现样式呈现给办案人员,帮助他们快速了解案件信息。然而,在实现本专利技术的过程中,专利技术人发现现有技术存在以下问题:起诉意见书中的数据信息仅仅是通过提取得到的段落片段,没有具体到字词级别,想直接获悉数据还需要进一步阅读,本文档来自技高网...

【技术保护点】
1.一种司法文书信息提取和关联展示方法,其特征在于,包括:/n利用实体识别规则分别从司法文书的每个犯罪事实中识别抽取出对应的实体集合,所述实体识别规则为用于识别时间、地点和人物三种实体属性的规则,所述犯罪事实为司法文书中犯罪事实的陈述段落,所述实体集合包括至少一种实体属性;/n利用轴生成规则将实体集合进行时间轴展示,所述轴生成规则为用于确定时间轴样式的规则,所述时间轴样式包括时间轴中事件框的分布布局;/n利用关联规则实现时间轴与司法文书之间的关联展示,所述关联规则为用于犯罪事实与事件框之间信息联动的规则,所述信息联动唯一且对应;/n按照司法文书中犯罪事实的实体属性和时间轴样式,对应存储从所述犯...

【技术特征摘要】
1.一种司法文书信息提取和关联展示方法,其特征在于,包括:
利用实体识别规则分别从司法文书的每个犯罪事实中识别抽取出对应的实体集合,所述实体识别规则为用于识别时间、地点和人物三种实体属性的规则,所述犯罪事实为司法文书中犯罪事实的陈述段落,所述实体集合包括至少一种实体属性;
利用轴生成规则将实体集合进行时间轴展示,所述轴生成规则为用于确定时间轴样式的规则,所述时间轴样式包括时间轴中事件框的分布布局;
利用关联规则实现时间轴与司法文书之间的关联展示,所述关联规则为用于犯罪事实与事件框之间信息联动的规则,所述信息联动唯一且对应;
按照司法文书中犯罪事实的实体属性和时间轴样式,对应存储从所述犯罪事实中提取出的实体集合以及犯罪事实与时间轴之间的关联关系。


2.根据权利要求1所述的方法,其特征在于,所述的实体识别规则,包括时间表达式、地点表达式和人物表达式,所述时间表达式用于识别抽取犯罪事实中的时间实体,所述地点表达式用于识别抽取犯罪事实中的地点实体,所述人物表达式用于识别抽取犯罪事实中的人物实体;
利用实体识别规则分别从司法文书的每个犯罪事实中识别抽取出对应的实体集合的步骤,包括:
将时间表达式、地点表达式和人物表达式分别与第i犯罪事实匹配,识别出第i犯罪事实的时间、地点和人物实体属性;其中i=1,2,……,m-1,m;m表示司法文书中犯罪事实的总数量;
将识别出第i犯罪事实的时间、地点和人物实体属性作为第i犯罪事实的实体集合。


3.根据权利要求1所述的方法,其特征在于,所述轴生成规则包括与时间轴样式对应的样式表达式;
利用轴生成规则将实体集合进行时间轴展示的步骤,包括:
将样式表达式与每个犯罪事实的实体集合进行匹配,根据司法文书中犯罪事实的总数量m生成具有m个事件框的时间轴,所述事件框展示的内容为对应犯罪事实的实体集合,即第i事件框展示的内容为第i犯罪事实的实体集合,其中i=1,2,……,m-1,m。


4.根据权利要求1所述的方法,其特征在于,所述关联规则包括第一类关联表达式和第二类关联表达式,所述第一类关联表达式用于实现从犯罪事实到事件框的关联展示,所述第二类关联表达式用于实现从事件框到犯罪事实的关联展示;
利用关联规则实现时间轴与司法文书之间的关联展示的步骤,包括:
将点击选取的第i犯罪事实与第一类关联表达式匹配,高亮司法文书中第i犯罪事实,同时关联高亮时间轴第i事件框;
将点击选取的第i事件框与第二类关联表达式匹配,高亮时间轴中第i事件框,同时关联高亮司法文书中第i犯罪事实。


5.一种司法文书信息提取和关联展示装置,其特征在于,包括:
...

【专利技术属性】
技术研发人员:孙媛媛王小鹏许策陈彦光王刚
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1