【技术实现步骤摘要】
用于电子文档判别勘误的智能方法
本专利技术涉及电子文档判别领域,具体涉及一种用于电子文档判别勘误的智能方法。
技术介绍
大数据时代的到来使得许多传统行业紧随这一股浪潮进行了改革。电子文档就是互联网时代的产物,包括电子病历、电子笔录等在内。相关工作人员每天都几乎要面临的一项工作就是书写电子文档,以电子笔录为例,警察需要根据每件案子的情况撰写电子笔录,记录下详细的案情描述和处理措施,由于大部分警察并非专业的打字员,同时在案情较多的情况下,所书写的电子笔录存在着相关信息缺失、电子笔录格式信息错误以及语义逻辑信息等问题。传统技术存在以下技术问题:目前绝大多数警察在撰写电子笔录时采用的方式基本上基于已有的格式采用复制黏贴的方式撰写电子笔录,撰写的电子病历书往往不符合要求,因此常常因为书写的不规范和错误,给案情纠纷埋下隐患。同样的问题在包括电子病历、电子登记信息等文档信息方面也经常出现。
技术实现思路
本专利技术要解决的技术问题是提供一种用于电子文档判别勘误的智能方法,对相关领域电子文档中存在的格式错误、信息缺失、语义逻辑错误的问题,判断相关领域的专业文档的合规性,并对出现的错误做出纠错处理,减少相关文档出错的问题,提高相关工作人员的工作效率。为了解决上述技术问题,本专利技术提供了一种用于电子文档判别勘误的智能方法,包括:步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;步骤200、判断步骤100中获得的结构化文档 ...
【技术保护点】
1.一种用于电子文档判别勘误的智能方法,其特征在于,包括:/n步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据。/n步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;/n步骤300、分析文档语义逻辑信息,包括文档语义关系信息、语义依存关系和语义角色标注;/n步骤400、通过步骤300得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。/n
【技术特征摘要】
1.一种用于电子文档判别勘误的智能方法,其特征在于,包括:
步骤100、采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据。
步骤200、判断步骤100中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;
步骤300、分析文档语义逻辑信息,包括文档语义关系信息、语义依存关系和语义角色标注;
步骤400、通过步骤300得到的信息判断文档语义逻辑上是否存在谬误,是否符合相关领域要求。
2.如权利要求1所述的用于电子文档判别勘误的智能方法,其特征在于,步骤200具体步骤如下:
步骤210读取步骤100获得的结构化文档数据;
步骤220:文档格式信息判断,对结构化的文档数据进行审查,如果数据中存在空值,则进入步骤240,若数据中不存在空值,则进入步骤230;
步骤230:格式审查通过,保留文档数据;
步骤240:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤100,重新开始进行文档格式信息审查。
3.如权利要求1所述的用于电子文档判别勘误的智能方法,其特征在于,步骤400具体步骤如下:
步骤410:读取文档数据;
步骤420:判断文档中相关实体是否缺失,即相关实体是否为空值,若缺失实体则转入步骤440,如果不缺少实体,则转入步骤430,开始进行实体关系审查;
步骤430:判断关系三元组是否缺失,是否存在逻辑错误、是否符合相关领域的要求,若存在问题,则转入步骤440,若不存在问题,则转入步骤450;
步骤440:输出报错信息,工作人员根据报错信息修改原文档,并返回步骤300,重新开始进行文档语义逻辑审查;
步骤450:文档合规性判别通过。
4.一种用于电子文档判别勘误的智能系统,其特征在于,包括:
文档信息采集分析模块,此模块用于采集相关文档的信息并通过自然语言处理技术实现知识粒度的切割,将文本信息转化为无噪声的文本数据;
文档格式信息判断纠错模块,此模块用于判断模块文档信息采集分析模块中获得的结构化文档信息是否符合相关领域的格式要求,文档信息是否缺失并根据报错信息返回修改;
文档语义逻辑信息分...
【专利技术属性】
技术研发人员:李华康,王磊,王永超,方浪,孔令军,
申请(专利权)人:苏州派维斯信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。