用于电子文档判别勘误的智能方法技术

技术编号:22914012 阅读:18 留言:0更新日期:2019-12-24 21:51
本发明专利技术公开了一种用于电子文档判别勘误的智能方法。本发明专利技术一种用于电子文档判别勘误的智能方法,包括:步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改。本发明专利技术的有益效果:本发明专利技术针对相关领域电子文档中存在的格式错误、信息缺失、语义逻辑错误的问题,提出一种用于自动判别电子文档合规性并勘误的智能方法,判断相关领域的专业文档的合规性,减少相关文档的错误,提高相关工作人员的工作效率。

【技术实现步骤摘要】
用于电子文档判别勘误的智能方法
本专利技术涉及电子文档判别领域,具体涉及一种用于电子文档判别勘误的智能方法。
技术介绍
大数据时代的到来使得许多传统行业紧随这一股浪潮进行了改革。电子文档就是互联网时代的产物,包括电子病历、电子笔录等在内。相关工作人员每天都几乎要面临的一项工作就是书写电子文档,以电子笔录为例,警察需要根据每件案子的情况撰写电子笔录,记录下详细的案情描述和处理措施,由于大部分警察并非专业的打字员,同时在案情较多的情况下,所书写的电子笔录存在着相关信息缺失、电子笔录格式信息错误以及语义逻辑信息等问题。传统技术存在以下技术问题:目前绝大多数警察在撰写电子笔录时采用的方式基本上基于已有的格式采用复制黏贴的方式撰写电子笔录,撰写的电子病历书往往不符合要求,因此常常因为书写的不规范和错误,给案情纠纷埋下隐患。同样的问题在包括电子病历、电子登记信息等文档信息方面也经常出现。
技术实现思路
本专利技术要解决的技术问题是提供一种用于电子文档判别勘误的智能方法,对相关领域电子文档中存在的格式错误、信息缺失、语义逻辑错误的问题,判断相关领域的专业文档的合规性,并对出现的错误做出纠错处理,减少相关文档出错的问题,提高相关工作人员的工作效率。为了解决上述技术问题,本专利技术提供了一种用于电子文档判别勘误的智能方法,包括:步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;步骤300、分析文档语义逻辑信息,包括文档语义关系信息、语义依存关系和语义角色标注;步骤400、通过步骤300得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。在其中一个实施例中,步骤200具体步骤如下:步骤210读取步骤100获得的结构化文档数据;步骤220:文档格式信息判断,对结构化的文档数据进行审查,如果数据中存在空值,则进入步骤240,若数据中不存在空值,则进入步骤230;步骤230:格式审查通过,保留文档数据;步骤240:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤100,重新开始进行文档格式信息审查。在其中一个实施例中,步骤400具体步骤如下:步骤410:读取文档数据步骤420:判断文档中相关实体是否缺失,即相关实体是否为空值,若缺失实体则转入步骤440,如果不缺少实体,则转入步骤430,开始进行实体关系审查;步骤430:判断关系三元组是否缺失,是否存在逻辑错误、是否符合相关领域的要求,若存在问题,则转入步骤440,若不存在问题,则转入步骤450;步骤440:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤300,重新开始进行文档语义逻辑审查;步骤450:文档合规性判别通过。一种用于电子文档判别勘误的智能系统,包括:文档信息采集分析模块,此模块用于采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;文档格式信息判断纠错模块,此模块用于判断模块文档信息采集分析模块中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;文档语义逻辑信息分析模块,用于分析文档语义逻辑信息,包括文档语义关系信息,语义依存关系和语义角色标注;以及文档语义逻辑信息判断纠错模块,通过文档语义逻辑分析模块得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。在其中一个实施例中,文档格式信息判断纠错模块具体包括:步骤210:读取文档信息采集分析模块获得的结构化文档数据;步骤220:文档格式信息判断,对结构化的文档数据进行审查,如果数据中存在空值,则进入步骤240,若数据中不存在空值,则进入步骤230;步骤230:格式审查通过,保留文档数据;步骤240:输出报错信息,工作人员根据报错信息修改原文档,并返回文档信息采集分析模块,重新开始进行文档格式信息审查。在其中一个实施例中,文档语义逻辑信息判断纠错模块具体如下:步骤410:读取文档数据;步骤420:判断文档中相关实体是否缺失,即相关实体是否为空值,若缺失实体则转入步骤440,如果不缺少实体,则转入步骤430,开始进行实体关系审查;步骤430:判断关系三元组是否缺失,是否存在逻辑错误、是否符合相关领域的要求,若存在问题,则转入步骤440,若不存在问题,则转入步骤450;步骤440:输出报错信息,工作人员根据报错信息修改原文档,并返回文档语义逻辑信息分析模块,重新开始进行文档语义逻辑审查;步骤450:文档合规性判别通过。在其中一个实施例中,文档语义逻辑信息分析模块中,具体操作包括实体识别和关系抽取。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一项所述的方法。本专利技术的有益效果:本专利技术针对相关领域电子文档中存在的格式错误、信息缺失、语义逻辑错误的问题,提出一种用于自动判别电子文档合规性并勘误的智能方法,判断相关领域的专业文档的合规性,减少相关文档的错误,提高相关工作人员的工作效率。附图说明图1是文档合规性判别勘误方法的总体流程示意图。图2是文档格式信息判断纠错流程示意图。图3是文档语义逻辑信息判断纠错流程示意图。图4是文档合规性判别勘误方法中的询问笔录示意图。具体实施方式下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。图1是文档合规性判别勘误系统的总体流程示意图。概括来说,该方法主要包括:模块100)文档信息采集分析模块,此模块用于采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据。模块200)文档格式信息判断纠错模块,此模块用于判断模块100)中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改。具体步骤如下:步骤210:读取模块100获得的结构化文档数据步骤220:文档格式信息判断,对结构化的文档数据进行审查,如果数据中存在空值,则进入步骤240,若数据中不存在空值,则进入步骤230;步骤230:格式审查通过,保留文档数据;步骤240:输出报错信息,工作人员根据报错信息修改原文档,并返回模块100,重新开始进行文档格式信息审查。模本文档来自技高网...

【技术保护点】
1.一种用于电子文档判别勘误的智能方法,其特征在于,包括:/n步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据。/n步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;/n步骤300、分析文档语义逻辑信息,包括文档语义关系信息、语义依存关系和语义角色标注;/n步骤400、通过步骤300得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。/n

【技术特征摘要】
1.一种用于电子文档判别勘误的智能方法,其特征在于,包括:
步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据。
步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;
步骤300、分析文档语义逻辑信息,包括文档语义关系信息、语义依存关系和语义角色标注;
步骤400、通过步骤300得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。


2.如权利要求1所述的用于电子文档判别勘误的智能方法,其特征在于,步骤200具体步骤如下:
步骤210读取步骤100获得的结构化文档数据;
步骤220:文档格式信息判断,对结构化的文档数据进行审查,如果数据中存在空值,则进入步骤240,若数据中不存在空值,则进入步骤230;
步骤230:格式审查通过,保留文档数据;
步骤240:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤100,重新开始进行文档格式信息审查。


3.如权利要求1所述的用于电子文档判别勘误的智能方法,其特征在于,步骤400具体步骤如下:
步骤410:读取文档数据;
步骤420:判断文档中相关实体是否缺失,即相关实体是否为空值,若缺失实体则转入步骤440,如果不缺少实体,则转入步骤430,开始进行实体关系审查;
步骤430:判断关系三元组是否缺失,是否存在逻辑错误、是否符合相关领域的要求,若存在问题,则转入步骤440,若不存在问题,则转入步骤450;
步骤440:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤300,重新开始进行文档语义逻辑审查;
步骤450:文档合规性判别通过。


4.一种用于电子文档判别勘误的智能系统,其特征在于,包括:
文档信息采集分析模块,此模块用于采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;
文档格式信息判断纠错模块,此模块用于判断模块文档信息采集分析模块中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;
文档语义逻辑信息分...

【专利技术属性】
技术研发人员:李华康王磊王永超方浪孔令军
申请(专利权)人:苏州派维斯信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1