非标文本的更新提示方法以及电子设备技术

技术编号:31238049 阅读:21 留言:0更新日期:2021-12-08 10:23
本申请提供一种非标文本的更新提示方法及电子设备,所述方法包括:检索与非标文本相似的标准文本;提取非标文本中的非标实体词和非标实体词对应的非标实体类型以及标准文本中的标准实体词和标准实体词对应的标准实体类型;根据非标实体类型和标准实体类型相同的非标实体词和标准实体词,确定是否进行非标文本的更新提示。本的更新提示。本的更新提示。

【技术实现步骤摘要】
非标文本的更新提示方法以及电子设备


[0001]本申请涉及人工智能
,特别涉及一种非标文本的更新提示方法以及电子设备。

技术介绍

[0002]企业内部的制度有许多是根据外部法律制定而成,然而庞大的内部制度与不定时的法律更新,若全部由人力处理,容易产生许多疏漏,内部制度无法及时做正确的更新,可能使得企业陷入风险之中。

技术实现思路

[0003]本申请实施例提供了非标文本的更新提示方法,用以自动化管理企业内部的非标文本,及时发现非标文本是否需要更新。
[0004]本申请实施例提供了一种非标文本的更新提示方法,所述方法包括:
[0005]检索与非标文本相似的标准文本;
[0006]提取所述非标文本中的非标实体词和所述非标实体词对应的非标实体类型以及所述标准文本中的标准实体词和所述标准实体词对应的标准实体类型;
[0007]根据所述非标实体类型和标准实体类型相同的非标实体词和标准实体词,确定是否进行所述非标文本的更新提示。
[0008]在一实施例中,所述检索与非标文本相似的标准文本,包括:
[0009]获取多篇外部标准文档;
[0010]针对每篇外部标准文档,将所述外部标准文档划分为多个标准文档区块;
[0011]将所述非标文本划分为多个非标文档区块;
[0012]针对每篇外部标准文档,根据所述外部标准文档包含的标准文档区块与所述非标文本包含的非标文档区块之间的相似度,确定所述外部标准文档与所述非标文本是否相似,获得与所述非标文本相似的标准文本。
[0013]在一实施例中,所述将所述外部标准文档划分为多个标准文档区块,包括:
[0014]对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构;
[0015]根据所述外部标准文档的树状结构,将所述树状结构的最底层的文本内容作为一个标准文档区块,获得多个标准文档区块。
[0016]在一实施例中,所述对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构,包括:
[0017]若所述外部标准文档存在目录结构,通过文档解析软件获得所述树状结构。
[0018]在一实施例中,所述对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构,包括:
[0019]若所述外部标准文档不存在所述目录结构,将所述外部标准文档与预设的正则表达式进行匹配;
[0020]根据匹配的正则表达式,获得所述外部标准文档的树状结构。
[0021]在一实施例中,所述根据所述外部标准文档包含的标准文档区块与所述非标文本包含的非标文档区块之间的相似度,确定所述外部标准文档与所述非标文本是否相似,包括:
[0022]确定所述外部标准文档包含的每一标准文档区块与所述非标文本包含的每一非标文档区块之间的相似度;
[0023]若所述外部标准文档包含的任一标准文档区块与所述非标文本包含的任一非标文档区块之间的相似度大于阈值,则所述外部标准文档与所述非标文本相似。
[0024]在一实施例中,所述计算所述外部标准文档包含的每一标准文档区块与所述非标文本包含的每一非标文档区块之间的相似度,包括:
[0025]针对每一标准文档区块与每一非标文档区块,将所述标准文档区块转换成第一特征向量以及将所述非标文档区块转换成第二特征向量;
[0026]计算所述第一特征向量与所述第二特征向量之间的相似度,获得所述标准文档区块与所述非标文档区块之间的相似度。
[0027]在一实施例中,所述将所述标准文档区块转换成第一特征向量,包括:
[0028]从所述标准文档区块中提取一元组词和二元组词;
[0029]根据词袋库中按序排列的每个词汇是否为所述一元组词或二元组词,生成所述第一特征向量。
[0030]在一实施例中,所述提取所述非标文本中的非标实体词和所述非标实体词对应的非标实体类型以及所述标准文本中的标准实体词和所述标准实体词对应的标准实体类型;
[0031]将所述非标文本作为已训练的序列标注模型的输入,获得所述序列标注模型输出的非标实体词和所述非标实体词对应的非标实体类型;
[0032]将所述标准文本作为已训练的序列标注模型的输入,获得所述序列标注模型输出的标准实体词和所述标准实体词对应的标准实体类型。
[0033]在一实施例中,所述根据所述非标实体类型和标准实体类型相同的非标实体词和标准实体词,确定是否进行所述非标文本的更新提示,包括:
[0034]若所述非标实体类型和标准实体类型相同的非标实体词和标准实体词之间的差异不符合预设业务规则,进行所述非标文本的更新提示。
[0035]在一实施例中,所述进行所述非标文本的更新提示,包括:
[0036]将不符合预设业务规则的所述非标实体词、所述标准实体词、所述标准文本和所述非标文本发送到监管客户端进行显示。
[0037]本申请实施例还提供了一种电子设备,所述电子设备包括:
[0038]处理器;
[0039]用于存储处理器可执行指令的存储器;
[0040]其中,所述处理器被配置为执行上述非标文本的更新提示方法。
[0041]本申请上述实施例提供的技术方案,通过检索出与非标文本相似的标准文本;提取非标文本中的非标实体词和非标实体词对应的非标实体类型以及标准文本中的标准实体词和标准实体词对应的标准实体类型;根据非标实体类型和标准实体类型相同的非标实体词和标准实体词,确定是否进行所述非标文本的更新提示。从而可以实现非标文本和标
准文本的自动化管控,在标准文本发生更新时,及时提醒用户需要进行非标文本的更新,降低人工监控的工作量以及监控难度,解决人工监控不全面、不及时、工作量大的缺陷。
附图说明
[0042]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
[0043]图1是本申请实施例提供的电子设备的结构示意图;
[0044]图2是本申请实施例提供的非标文本的更新提示方法的流程示意图;
[0045]图3是图2对应实施例的步骤S210的细节流程图;
[0046]图4是图3对应实施例中将外部标准文档划分为多个标准文档区块的细节流程图;
[0047]图5是图3对应实施例中步骤S213的细节流程图;
[0048]图6为本申请一实施例示出的非标文本的更新提示装置的框图。
具体实施方式
[0049]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
[0050]相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0051]图1是本申请实施例提供的电子设备的结构示意图。该电子设备100可以用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非标文本的更新提示方法,其特征在于,所述方法包括:检索与非标文本相似的标准文本;提取所述非标文本中的非标实体词和所述非标实体词对应的非标实体类型以及所述标准文本中的标准实体词和所述标准实体词对应的标准实体类型;根据所述非标实体类型和标准实体类型相同的非标实体词和标准实体词,确定是否进行所述非标文本的更新提示。2.根据权利要求1所述的方法,其特征在于,所述检索与非标文本相似的标准文本,包括:获取多篇外部标准文档;针对每篇外部标准文档,将所述外部标准文档划分为多个标准文档区块;将所述非标文本划分为多个非标文档区块;针对每篇外部标准文档,根据所述外部标准文档包含的标准文档区块与所述非标文本包含的非标文档区块之间的相似度,确定所述外部标准文档与所述非标文本是否相似,获得与所述非标文本相似的标准文本。3.根据权利要求2所述的方法,其特征在于,所述将所述外部标准文档划分为多个标准文档区块,包括:对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构;根据所述外部标准文档的树状结构,将所述树状结构的最底层的文本内容作为一个标准文档区块,获得多个标准文档区块。4.根据权利要求3所述的方法,其特征在于,所述对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构,包括:若所述外部标准文档存在目录结构,通过文档解析软件获得所述树状结构。5.根据权利要求3所述的方法,其特征在于,所述对所述外部标准文档进行文档解析,确定所述外部标准文档的树状结构,包括:若所述外部标准文档不存在目录结构,将所述外部标准文档与预设的正则表达式进行匹配;根据匹配的正则表达式,获得所述外部标准文档的树状结构。6.根据权利要求2所述的方法,其特征在于,所述根据所述外部标准文档包含的标准文档区块与所述非标文本包含的非标文档区块之间的相似度,确定所述外部标准文档与所述非标文本是否相似,包括:确定所述外部标准文档包含的每一标准文档区块与所述非标文本包含的每一非标文档区块之间的相似度;若所述外部标准文档包含的任一标准文档区块与所述非标文本包含的任一非标文档区...

【专利技术属性】
技术研发人员:简仁贤李佳纯罗泽扬林威志
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1