【技术实现步骤摘要】
一种命名实体的纠错方法、装置及电子设备
[0001]本专利技术涉及计算机
,尤其涉及一种命名实体的纠错方法、装置及电子设备。
技术介绍
[0002]法律裁判文书作为法律行业重要的公开法律文件,承载了大量信息可供数据分析和挖掘,但由于是人工录入、出现少量文字错误在所难免,虽然也有后续的校核环节,但对于既没有语法错误、又不属于严谨的法律术语的语句,传统人工校核或机器校核几乎是无法彻底检测出来。
技术实现思路
[0003]本说明书提供一种命名实体的纠错方法、装置及电子设备,在无需对具体某种错误单独设定纠错规则的情况下,能够全面纠正法律文书中已知、未知的明显错误,降低了维护成本。
[0004]本申请提供的一种命名实体的纠错方法,采用如下的技术方案,包括:
[0005]获取待处理的法律文书的文本信息;
[0006]从所述文本信息中识别多个命名实体;
[0007]基于所述多个命名实体构建图结构数据;
[0008]对比所述图结构数据与历史库数据修复法律文书中的命名实体的错误。< ...
【技术保护点】
【技术特征摘要】
1.一种命名实体的纠错方法,其特征在于,包括:获取待处理的法律文书的文本信息;从所述文本信息中识别多个命名实体;基于所述多个命名实体构建图结构数据;对比所述图结构数据与历史库数据修复法律文书中的命名实体的错误。2.根据权利要求1所述的一种命名实体的纠错方法,其特征在于,所述从所述文本信息中识别多个命名实体,包括:将所述文本信息转换为法律文书的文本向量;通过法律文书命名实体识别神经网络,从所述文本向量中提取法律文书的文本特征;通过法律文书命名实体识别概率模型,从所述法律文书的文本特征中识别所述文本信息中包含的所述多个命名实体。3.根据权利要求2所述的一种命名实体的纠错方法,其特征在于,所述法律文书命名实体识别神经网络为双向长短期记忆神经网络。4.根据权利要求1所述的一种命名实体的纠错方法,其特征在于,所述对比所述图结构数据与历史库数据修复法律文书中的命名实体的错误,包括:对比所述图结构数据与所述历史库数据,获得待修复命名实体;基于所述待修复命名实体生成待修复的图结构数据;基于所述待修复的图结构数据与所述历史库数据,纠正所述待修复命名实体,修复法律文书中的命名实体的错误。5.根据权利要求4所述的一种命名实体的纠错方法,其特征在于,所述对比所述图结构数据与所述历史库数据,获得待修复命名实体,包括:对比所述图结构数据与所述历史库数据的同一命名实体属性的命名实体属性值;若同一命名实体属性的命名实体属性值相同,则保留所述图结构数据的所述命名实体属性值;若同一命名实体属性的命名实体属性值不同,则标记所述图结构数据的所述命名实体为所述待修复命名实体。6.根据权利要求5所述的一种命名实体的纠错方法,其特征在于,所述纠正所述待修复命名实体,包括:识别所述待修复命名实体种类,所述待修复命名实体种类包括第一纠错码、第二纠错码和第三纠错码;识别所述待修复命名实体属性是否是第一命名实体属性;若所述待修复命名...
【专利技术属性】
技术研发人员:晏永年,檀海松,余畅池,
申请(专利权)人:赢火虫信息科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。