【技术实现步骤摘要】
用于裁判文书的证据信息提取方法及装置
本申请涉及数据处理
,特别涉及一种用于裁判文书的证据信息提取方法及装置。
技术介绍
裁判文书作为法律文件,内容较为冗长,用词较为晦涩难懂,令人很难快速从整体裁判文书中定位需要仔细浏览的内容。例如,用户需要从裁判文书中查找与证据相关的内容,则需要从裁判文书的首个字符开始浏览,在了解裁判文书所阐述的各部分内容之后,判断证据可能出现的部分内容,进一步从该部分内容中抽取与证据相关的内容。但是,这种通过人工分析裁判文书提取证据信息的方式不仅费时,而且会受到学识、思维等不定因素的影响,容易导致所获取的证据信息准确性较低,不具有参考价值。基于此,目前亟需一种用于裁判文书的证据信息提取方法,用于解决现有技术中人工提取证据信息的方式费时费力,且容易导致所获取的证据信息准确性较低的问题。
技术实现思路
本申请提供了一种用于裁判文书的证据信息提取方法及装置,可用于解决现有技术中人工提取证据信息的方式费时费力,且容易导致所获取的证据信息准确性较低的技术问题。第一 ...
【技术保护点】
1.一种用于裁判文书的证据信息提取方法,其特征在于,所述方法包括:/n获取裁判文书文本;/n对所述裁判文书文本进行预处理,得到预处理后的裁判文书文本;/n根据预设的犯罪事实起始关键词,和预设的犯罪事实结束关键词,从所述预处理后的裁判文书文本中提取出犯罪事实文本;/n根据预设的证据表述起始关键词,和预设的证据表述结束关键词,从所述预处理后的裁判文书文本中提取出证据表述文本;/n针对任一犯罪事实文本,根据所述犯罪事实文本对应的位置索引和各证据表述文本对应的位置索引,确定所述犯罪事实文本对应的目标证据表述文本;/n根据目标证据类型,以及预设的证据类型与证据提取规则之间的对应关系, ...
【技术特征摘要】
1.一种用于裁判文书的证据信息提取方法,其特征在于,所述方法包括:
获取裁判文书文本;
对所述裁判文书文本进行预处理,得到预处理后的裁判文书文本;
根据预设的犯罪事实起始关键词,和预设的犯罪事实结束关键词,从所述预处理后的裁判文书文本中提取出犯罪事实文本;
根据预设的证据表述起始关键词,和预设的证据表述结束关键词,从所述预处理后的裁判文书文本中提取出证据表述文本;
针对任一犯罪事实文本,根据所述犯罪事实文本对应的位置索引和各证据表述文本对应的位置索引,确定所述犯罪事实文本对应的目标证据表述文本;
根据目标证据类型,以及预设的证据类型与证据提取规则之间的对应关系,确定目标证据提取规则;所述证据提取规则是根据证据类型对应的关键词、证据类型对应的上下文语境和证据类型对应的符号中的至少一项确定的;
采用所述目标证据提取规则,从所述目标证据表述文本中提取出目标证据信息。
2.根据权利要求1所述的方法,其特征在于,采用所述目标证据提取规则,从所述目标证据表述文本中提取出目标证据信息,包括:
采用所述目标证据提取规则,从所述目标证据表述文本中提取出多个候选目标证据信息;
判断第一候选目标证据信息的位置索引与第二候选目标证据信息的位置索引是否相同,如果所述第一候选目标证据信息的位置索引与所述第二候选目标证据信息的位置索引相同,则将所述第一候选目标证据信息或所述第二候选目标证据信息中任一候选目标证据信息,确定为目标证据信息;
如果所述第一候选目标证据信息的位置索引与所述第二候选目标证据信息的位置索引不同,则判断所述第一候选目标证据信息与所述第二候选目标证据信息是否存在内容交叉;
如果所述第一候选目标证据信息与所述第二候选目标证据信息存在内容交叉,则将所述第一候选目标证据信息与所述第二候选目标证据信息合并后,作为所述目标证据信息;
如果所述第一候选目标证据信息与所述第二候选目标证据信息不存在内容交叉,则将所述第一候选目标证据信息与所述第二候选目标证据信息确定为所述目标证据信息。
3.根据权利要求1所述的方法,其特征在于,根据预设的犯罪事实起始关键词,和预设的犯罪事实结束关键词,从所述预处理后的裁判文书文本中提取出犯罪事实文本,包括:
根据预设的犯罪事实起始关键词,和预设的犯罪事实结束关键词,从所述预处理后的裁判文书文本中提取出至少一个候选犯罪事实文本;
如果第一候选犯罪事实文本的位置索引与第二候选犯罪事实文本的位置索引不同,则将所述第一候选犯罪事实文本和所述第二候选犯罪事实文本确定为所述犯罪事实文本;
如果所述第一候选犯罪事实文本的位置索引与所述第二候选犯罪事实文本的位置索引相同,则将所述第一候选犯罪事实文本或所述第二候选犯罪事实文本中任一候选犯罪事实文本,确定为所述犯罪事实文本;
其中,所述第一候选犯罪事实文本为所述至少一个候选犯罪事实文本中任意一个候选犯罪事实文本,所述第二候选犯罪事实文本为所述至少一个候选犯罪事实文本中除所述第一候选犯罪事实文本以外的任意一个候选犯罪事实文本。
4.根据权利要求1所述的方法,其特征在于,根据预设的证据表述起始关键词,和预设的证据表述结束关键词,从所述预处理后的裁判文书文本中提取出证据表述文本,包括:
根据预设的证据表述起始关键词,和预设的证据表述结束关键词,从所述预处理后的裁判文书文本中提取出至少一个候选证据表述文本;
如果第一候选证据表述文本的位置索引与第二候选证据表述文本的位置索引不同,则将所述第一候选证据表述文本和所述第二证据表述文本确定为所述证据表述文本;
如果所述第一候选证据表述文本的位置索引与所述第二候选证据表述文本的位置索引相同,则将所述第一候选证据表述文本或所述第二候选证据表述文本中任一候选证据表述文本,确定为所述证据表述文本;
其中,所述第一候选证据表述文本为所述至少一个候选证据表述文本中任意一个候选证据表述文本,所述第二候选证据表述文本为所述至少一个候选证据表述文本中除所述第一候选证据表述文本以外的任意一个候选证据表述文本。
5.根据权利要求1所述的方法,其特征在于,所述目标证据类型是实物...
【专利技术属性】
技术研发人员:晋耀红,李德彦,刘大双,张志一,
申请(专利权)人:鼎富智能科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。