用于法律裁判文书的信息处理方法及装置制造方法及图纸

技术编号:15616685 阅读:84 留言:0更新日期:2017-06-14 03:31
本申请公开了一种用于法律裁判文书的信息处理方法及装置。该方法包括:获取法律裁判文书的目标文本内容;检测目标文本内容中是否存在与第一预设规则相匹配的文本内容;如果检测出目标文本内容中存在与第一预设规则相匹配的文本内容,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及将至少一个目标关键词存储至同一个关键词集合。通过本申请,解决了相关技术中从法律裁判文书中提取出的关键词无法体现关键词之间的相关性的技术问题。

【技术实现步骤摘要】
用于法律裁判文书的信息处理方法及装置
本申请涉及文本处理领域,具体而言,涉及一种用于法律裁判文书的信息处理方法及装置。
技术介绍
刑事法务工作者在处理案件时,往往需要对案件所涉及的罪名、刑罚判处类型、刑罚处罚量、判决所依据的法条等进行综合考虑,以在实际工作中将其作为工作参考数据。这些参考数据的来源一般是人民法院已经判决并公开的大量案件,通过对案件做大数据分析统计得出的结果。相关技术中,在对案件做大数据分析统计时,会临时遍历所有案件相关的法律裁判文书,以取得案件中包含的关键词。由于人民法院审查判决的刑事案件中涉及到的刑罚信息点多、信息量大、内容复杂、表示多样化,并且判决依据的法条种类也较多,例如,刑事案由罪名种类繁多,依据不同罪名判处的刑罚类型不同且量刑也不同。因此,在利用该方法对法律裁判文书数据集查询数据时,由于对全文逐字查找,对服务器造成了很大的压力,并且耗时很长;临时查找出的结果无法体现关键词之间的相关性(例如刑罚信息之间的相关性),不利于进行大数据统计分析。针对相关技术中从法律裁判文书中提取出的关键词无法体现关键词之间的相关性的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种用于法律裁判文书的信息处理方法及装置,以至少解决相关技术中从法律裁判文书中提取出的关键词无法体现关键词之间的相关性的技术问题。根据本申请实施例的一个方面,提供了一种用于法律裁判文书的信息处理方法。该方法包括:获取法律裁判文书的目标文本内容;检测目标文本内容中是否存在与第一预设规则相匹配的文本内容;如果检测出目标文本内容中存在与第一预设规则相匹配的文本内容,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及将至少一个目标关键词存储至同一个关键词集合。进一步地,检测目标文本内容中是否存在与第一预设规则相匹配的文本内容包括:判断目标文本内容是否满足以下条件:存在至少一个第一预设特征关键词,并且至少一个第一预设特征关键词位于预设位置,其中,如果判断出目标文本内容中存在至少一个第一预设特征关键词,并且至少一个第一预设特征关键词位于预设位置,则确定目标文本内容中存在与第一预设规则相匹配的文本内容。进一步地,第一预设规则包括多个预设子规则,检测目标文本内容中是否存在与第一预设规则相匹配的文本内容包括:依次检测目标文本内容中是否存在与多个预设子规则相匹配的文本内容;以及将第一个检测到的存在相匹配的文本内容的预设子规则作为目标子规则,根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词包括:根据目标子规则提取目标文本内容中的至少一个目标关键词。进一步地,在检测出目标文本内容中存在与第一预设规则相匹配的文本内容的情况下,在根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词之前,该方法还包括:检测与第一预设规则相匹配的文本内容是否与第二预设规则相匹配,其中,如果检测出与第一预设规则相匹配的文本内容与第二预设规则相匹配,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词。进一步地,检测与第一预设规则相匹配的文本内容是否与第二预设规则相匹配包括:检测与第一预设规则相匹配的文本内容中的第二预设特征关键词的词性是否为预设词性,其中,第二预设特征关键词是按照第三预设规则将与第一预设规则相匹配的文本内容进行拆分得到的关键词,其中,如果检测出与第一预设规则相匹配的文本内容中的第二预设特征关键词的词性为预设词性,则确定与第一预设规则相匹配的文本内容与第二预设规则相匹配。进一步地,在将至少一个目标关键词存储至同一个关键词集合之前,该方法还包括:将至少一个目标关键词中的非阿拉伯数字形式的数字转换为阿拉伯数字形式,其中,将转换为阿拉伯数字形式的数字存储至同一个关键词集合。根据本申请实施例的另一方面,还提供了一种用于法律裁判文书的信息处理装置。该装置包括:获取单元,用于获取法律裁判文书的目标文本内容;第一检测单元,用于检测目标文本内容中是否存在与第一预设规则相匹配的文本内容;提取单元,用于如果检测出目标文本内容中存在与第一预设规则相匹配的文本内容,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及存储单元,用于将至少一个目标关键词存储至同一个关键词集合。进一步地,第一检测单元包括:判断模块,用于判断目标文本内容是否满足以下条件:存在至少一个第一预设特征关键词,并且至少一个第一预设特征关键词位于预设位置,其中,如果判断出目标文本内容中存在至少一个第一预设特征关键词,并且至少一个第一预设特征关键词位于预设位置,则确定目标文本内容中存在与第一预设规则相匹配的文本内容。进一步地,第一预设规则包括多个预设子规则,第一检测单元包括:检测模块,用于依次检测目标文本内容中是否存在与多个预设子规则相匹配的文本内容;以及确定模块,用于将第一个检测到的存在相匹配的文本内容的预设子规则作为目标子规则,提取单元包括:提取模块,用于根据目标子规则提取目标文本内容中的至少一个目标关键词。进一步地,该装置还包括:第二检测单元,用于检测与第一预设规则相匹配的文本内容是否与第二预设规则相匹配,其中,如果检测出与第一预设规则相匹配的文本内容与第二预设规则相匹配,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词。在本申请实施例中,采用包括以下步骤的方法:获取法律裁判文书的目标文本内容;检测目标文本内容中是否存在与第一预设规则相匹配的文本内容;如果检测出目标文本内容中存在与第一预设规则相匹配的文本内容,则根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及将至少一个目标关键词存储至同一个关键词集合,解决了相关技术中从法律裁判文书中提取出的关键词无法体现关键词之间的相关性的技术问题,进而通过检测目标文本内容中是否存在与第一预设规则相匹配的文本内容,在目标文本内容中存在与第一预设规则相匹配的文本内容的情况下,根据第一预设规则从与第一预设规则相匹配的文本内容中提取至少一个目标关键词,并将至少一个目标关键词存储至同一个关键词集合,使得最终获取到的关键词集合代表了法律裁判文书中具有相关关系的一类关键词,从而实现了提取法律裁判文书中具有相关性的关键词的技术效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请第一实施例的用于法律裁判文书的信息处理方法的流程图;图2是根据本申请第二实施例的用于法律裁判文书的信息处理方法的流程图;以及图3是根据本申请实施例的用于法律裁判文书的信息处理装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”本文档来自技高网
...
用于法律裁判文书的信息处理方法及装置

【技术保护点】
一种用于法律裁判文书的信息处理方法,其特征在于,包括:获取法律裁判文书的目标文本内容;检测所述目标文本内容中是否存在与第一预设规则相匹配的文本内容;如果检测出所述目标文本内容中存在与所述第一预设规则相匹配的文本内容,则根据所述第一预设规则从与所述第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及将所述至少一个目标关键词存储至同一个关键词集合。

【技术特征摘要】
1.一种用于法律裁判文书的信息处理方法,其特征在于,包括:获取法律裁判文书的目标文本内容;检测所述目标文本内容中是否存在与第一预设规则相匹配的文本内容;如果检测出所述目标文本内容中存在与所述第一预设规则相匹配的文本内容,则根据所述第一预设规则从与所述第一预设规则相匹配的文本内容中提取至少一个目标关键词;以及将所述至少一个目标关键词存储至同一个关键词集合。2.根据权利要求1所述的方法,其特征在于,检测所述目标文本内容中是否存在与第一预设规则相匹配的文本内容包括:判断所述目标文本内容是否满足以下条件:存在至少一个第一预设特征关键词,并且所述至少一个第一预设特征关键词位于预设位置,其中,如果判断出所述目标文本内容中存在所述至少一个第一预设特征关键词,并且所述至少一个第一预设特征关键词位于所述预设位置,则确定所述目标文本内容中存在与所述第一预设规则相匹配的文本内容。3.根据权利要求1所述的方法,其特征在于,所述第一预设规则包括多个预设子规则,检测所述目标文本内容中是否存在与第一预设规则相匹配的文本内容包括:依次检测所述目标文本内容中是否存在与所述多个预设子规则相匹配的文本内容;以及将第一个检测到的存在所述相匹配的文本内容的预设子规则作为目标子规则,根据所述第一预设规则从与所述第一预设规则相匹配的文本内容中提取至少一个目标关键词包括:根据所述目标子规则提取所述目标文本内容中的至少一个目标关键词。4.根据权利要求1所述的方法,其特征在于,在检测出所述目标文本内容中存在与所述第一预设规则相匹配的文本内容的情况下,在根据所述第一预设规则从与所述第一预设规则相匹配的文本内容中提取至少一个目标关键词之前,所述方法还包括:检测与所述第一预设规则相匹配的文本内容是否与第二预设规则相匹配,其中,如果检测出与所述第一预设规则相匹配的文本内容与所述第二预设规则相匹配,则根据所述第一预设规则从与所述第一预设规则相匹配的文本内容中提取至少一个目标关键词。5.根据权利要求3所述的方法,其特征在于,检测与所述第一预设规则相匹配的文本内容是否与第二预设规则相匹配包括:检测与所述第一预设规则相匹配的文本内容中的第二预设特征关键词的词性是否为预设词性,其中,所述第二预设特征关键词是按照第三预设规则将与所述第一预设规则相匹配的...

【专利技术属性】
技术研发人员:胡斌杜宁
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1