实体识别方法、装置、设备和存储介质制造方法及图纸

技术编号:32118538 阅读:14 留言:0更新日期:2022-01-29 19:04
本发明专利技术公开了一种实体识别方法、装置、设备和存储介质,包括:利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;将词向量特征输入Transformer层,得到与词向量特征对应的语义全局特征向量,以及,将词向量特征输入TextRNN层,得到与词向量特征对应的词序列信息特征向量;将语义全局特征向量与词序列信息特征向量进行拼接,得到拼接向量特征;将拼接向量特征输入到预设的实体识别层中,输出词向量特征对应的标签作为实体识别结果,实现了在BERT预训练层的强大的语义表征能力的基础上,利用Transformer层解决梯度消失的问题,并由TextRNN层更好地利用序列之间的关系,得到比较精准的实体识别结果。得到比较精准的实体识别结果。得到比较精准的实体识别结果。

【技术实现步骤摘要】
实体识别方法、装置、设备和存储介质


[0001]本专利技术属于自然语言处理
,具体涉及一种实体识别方法、装置、设备和存储介质。

技术介绍

[0002]目前各公司对外采购的物料,通常依赖人工拆解接线图纸形成核价物料清单(Bill of Material,BOM)表,此过程依赖大量人工作业,耗时耗力,所以需要利用人工智能的语义分析与图片分析先进等技术结合完成接线图的原材料提取与用量统计。近几年来,随着人工智能的发展,在我们的日常生活中得到了广泛的应用。通常人们会从一段新闻或者文字中获取自己需要的且重要的信息,所以这个时候,命名实体识别技术就显得十分重要,他能帮助我们很快的从文本中检索出我们需要的关键信息,所以命名实体识别技术就可以应用到接线图纸形成核价BOM表这个项目中。命名实体识别能自动识别出人名、组织机构名、地名、时间等等实体信息。命名实体识别对于文本语义知识获取非常重要,而命名实体识别是事件或者关系抽取等技术的基石,对于非结构化的信息提取有重要意义作用。
[0003]目前,中文实体识别效果相对于英文来说,效果并不是很好,因为中文识别的相比英文有一定难度。早期的方法主要是基于规则和统计的方法,这些方法主要用语言学家手工设定的词法、句法和语义规则模板,效果不是很理想,模型的可移植性差,代价大。后有产生机器学习的方法,如条件随机场(Conditional Random Field,CRF)、支持向量机(Support Vector Machine,SVM)、隐马尔科夫等。这类方法的原理是通过人工构建特征模板提取特征,作为输入,学习前后一个词的语义信息,然后预测序列标签,然而,该方法无法表征字或者词的多义性。
[0004]因此,现有技术中实体识别结果的准确性较低。

技术实现思路

[0005]本专利技术的主要目的是提供一种实体识别方法、装置、设备和存储介质,以解决现有技术中实体识别结果的准确性的技术问题。
[0006]针对上述问题,本专利技术提供了一种实体识别方法,用于进行实体识别的实体识别模型包括BERT预训练层、Transformer层、TextRNN层和实体识别层;所述方法包括:
[0007]利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;
[0008]将所述词向量特征输入Transformer层,得到与所述词向量特征对应的语义全局特征向量,以及,将所述词向量特征输入TextRNN层,得到与所述词向量特征对应的词序列信息特征向量;
[0009]将所述语义全局特征向量与所述词序列信息特征向量进行拼接,得到拼接向量特征;
[0010]将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果。
[0011]进一步地,上述所述的实体识别方法中,所述实体识别层包括CRF层;
[0012]将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果,包括:
[0013]将所述拼接向量特征输入到所述CRF层中,得到文本中所有字符对应的所有标签的概率序列组成该文本的概率矩阵;
[0014]将最大概率对应的标签作为所述词向量特征对应的标签。
[0015]进一步地,上述所述的实体识别方法中,所述文本包括产品制作说明信息;
[0016]所述方法还包括:
[0017]根据所述实体识别结果,生成产品的核价物料清单信息。
[0018]进一步地,上述所述的实体识别方法,还包括:
[0019]检测所述核价物料清单信息与预设物料清单信息是否相匹配;
[0020]若所述核价物料清单信息与预设物料清单信息不匹配,确定异常物料对应的识别结果;
[0021]根据所述异常物料对应的识别结果,对所述实体识别模型进行更新。
[0022]进一步地,上述所述的实体识别方法中,利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征,包括:
[0023]对所述文本进行数据清理,得到清理文本;
[0024]对所述清理文本进行标注和分词,并进行训练,将所述清理文本表示为含有上下文语义信息的词向量特征。
[0025]本专利技术还提供了一种实体识别装置,包括:
[0026]BERT预训练层,用于将输入的文本表示为含有上下文语义信息的词向量特征;
[0027]Transformer层,用于得到与所述词向量特征对应的语义全局特征向量;
[0028]TextRNN层,用于得到与所述词向量特征对应的词序列信息特征向量;
[0029]实体识别层,用于将所述语义全局特征向量与所述词序列信息特征向量进行拼接,得到拼接向量特征,并对所述拼接向量特征进行识别,输出所述词向量特征对应的标签作为实体识别结果。
[0030]进一步地,上述所述的实体识别装置中,所述实体识别层包括CRF层;
[0031]所述CRF层具体用于:
[0032]得到文本中所有字符对应的所有标签的概率序列组成该文本的概率矩阵;
[0033]将最大概率对应的标签作为所述词向量特征对应的标签。
[0034]进一步地,上述所述的实体识别装置中,所述文本包括产品制作说明信息;
[0035]所述装置还包括:
[0036]物料生成层,用于根据所述实体识别结果,生成产品的核价物料清单信息。
[0037]本专利技术还提供了一种实体识别设备,包括存储器和控制器;
[0038]所述存储器上存储有计算机程序,所述计算机程序被控制器执行时实现如上任一项所述的实体识别方法的步骤。
[0039]本专利技术还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的实体识别方法的步骤。
[0040]与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效
果:
[0041]本专利技术的实体识别方法、装置、设备和存储介质,通过利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;将所述词向量特征输入Transformer层,得到与所述词向量特征对应的语义全局特征向量,以及,将所述词向量特征输入TextRNN层,得到与所述词向量特征对应的词序列信息特征向量;将所述语义全局特征向量与所述词序列信息特征向量进行拼接,得到拼接向量特征;将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果,实现了在BERT预训练层的强大的语义表征能力的基础上,利用Transformer层解决梯度消失的问题,并由TextRNN层更好地利用序列之间的关系,得到比较精准的实体识别结果。
[0042]本专利技术的其它特征和优点将在随后的说明书中阐述,并且部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0043]附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体识别方法,其特征在于,用于进行实体识别的实体识别模型包括BERT预训练层、Transformer层、TextRNN层和实体识别层;所述方法包括:利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;将所述词向量特征输入Transformer层,得到与所述词向量特征对应的语义全局特征向量,以及,将所述词向量特征输入TextRNN层,得到与所述词向量特征对应的词序列信息特征向量;将所述语义全局特征向量与所述词序列信息特征向量进行拼接,得到拼接向量特征;将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果。2.根据权利要求1所述的实体识别方法,其特征在于,所述实体识别层包括CRF层;将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果,包括:将所述拼接向量特征输入到所述CRF层中,得到文本中所有字符对应的所有标签的概率序列组成该文本的概率矩阵;将最大概率对应的标签作为所述词向量特征对应的标签。3.根据权利要求1所述的实体识别方法,其特征在于,所述文本包括产品制作说明信息;所述方法还包括:根据所述实体识别结果,生成产品的核价物料清单信息。4.根据权利要求3所述的实体识别方法,其特征在于,还包括:检测所述核价物料清单信息与预设物料清单信息是否相匹配;若所述核价物料清单信息与预设物料清单信息不匹配,确定异常物料对应的识别结果;根据所述异常物料对应的识别结果,对所述实体识别模型进行更新。5.根据权利要求1所述的实体识别方法,其特征在于,...

【专利技术属性】
技术研发人员:唐光远陈海波罗琴李润静熊琼陶武超
申请(专利权)人:珠海联云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1