实体识别方法、装置、设备和存储介质制造方法及图纸

技术编号:32118538 阅读:27 留言:0更新日期:2022-01-29 19:04
本发明专利技术公开了一种实体识别方法、装置、设备和存储介质,包括:利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;将词向量特征输入Transformer层,得到与词向量特征对应的语义全局特征向量,以及,将词向量特征输入TextRNN层,得到与词向量特征对应的词序列信息特征向量;将语义全局特征向量与词序列信息特征向量进行拼接,得到拼接向量特征;将拼接向量特征输入到预设的实体识别层中,输出词向量特征对应的标签作为实体识别结果,实现了在BERT预训练层的强大的语义表征能力的基础上,利用Transformer层解决梯度消失的问题,并由TextRNN层更好地利用序列之间的关系,得到比较精准的实体识别结果。得到比较精准的实体识别结果。得到比较精准的实体识别结果。

【技术实现步骤摘要】
实体识别方法、装置、设备和存储介质


[0001]本专利技术属于自然语言处理
,具体涉及一种实体识别方法、装置、设备和存储介质。

技术介绍

[0002]目前各公司对外采购的物料,通常依赖人工拆解接线图纸形成核价物料清单(Bill of Material,BOM)表,此过程依赖大量人工作业,耗时耗力,所以需要利用人工智能的语义分析与图片分析先进等技术结合完成接线图的原材料提取与用量统计。近几年来,随着人工智能的发展,在我们的日常生活中得到了广泛的应用。通常人们会从一段新闻或者文字中获取自己需要的且重要的信息,所以这个时候,命名实体识别技术就显得十分重要,他能帮助我们很快的从文本中检索出我们需要的关键信息,所以命名实体识别技术就可以应用到接线图纸形成核价BOM表这个项目中。命名实体识别能自动识别出人名、组织机构名、地名、时间等等实体信息。命名实体识别对于文本语义知识获取非常重要,而命名实体识别是事件或者关系抽取等技术的基石,对于非结构化的信息提取有重要意义作用。
[0003]目前,中文实体识别效果相对于英文来说,效果并不是很好,因为中文本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体识别方法,其特征在于,用于进行实体识别的实体识别模型包括BERT预训练层、Transformer层、TextRNN层和实体识别层;所述方法包括:利用BERT预训练层将输入的文本表示为含有上下文语义信息的词向量特征;将所述词向量特征输入Transformer层,得到与所述词向量特征对应的语义全局特征向量,以及,将所述词向量特征输入TextRNN层,得到与所述词向量特征对应的词序列信息特征向量;将所述语义全局特征向量与所述词序列信息特征向量进行拼接,得到拼接向量特征;将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果。2.根据权利要求1所述的实体识别方法,其特征在于,所述实体识别层包括CRF层;将所述拼接向量特征输入到预设的实体识别层中,输出所述词向量特征对应的标签作为实体识别结果,包括:将所述拼接向量特征输入到所述CRF层中,得到文本中所有字符对应的所有标签的概率序列组成该文本的概率矩阵;将最大概率对应的标签作为所述词向量特征对应的标签。3.根据权利要求1所述的实体识别方法,其特征在于,所述文本包括产品制作说明信息;所述方法还包括:根据所述实体识别结果,生成产品的核价物料清单信息。4.根据权利要求3所述的实体识别方法,其特征在于,还包括:检测所述核价物料清单信息与预设物料清单信息是否相匹配;若所述核价物料清单信息与预设物料清单信息不匹配,确定异常物料对应的识别结果;根据所述异常物料对应的识别结果,对所述实体识别模型进行更新。5.根据权利要求1所述的实体识别方法,其特征在于,...

【专利技术属性】
技术研发人员:唐光远陈海波罗琴李润静熊琼陶武超
申请(专利权)人:珠海联云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1