关系抽取的方法、装置、设备及存储介质制造方法及图纸

技术编号:32457874 阅读:24 留言:0更新日期:2022-02-26 08:40
本申请涉及一种关系抽取的方法、装置、设备及存储介质;其中,所述方法包括:获取与空调相关的至少两个待识别的文本;对各个所述待识别的文本进行语义编码,得到与所述待识别的文本各自对应的词向量;基于各个词向量,提取各个所述待识别的文本之间的依赖关系。本申请用以解决现有技术中,针对空调相关文本的关系抽取效果不理想的问题。取效果不理想的问题。取效果不理想的问题。

【技术实现步骤摘要】
关系抽取的方法、装置、设备及存储介质


[0001]本申请涉及自然语言处理
,尤其涉及一种关系抽取的方法、装置、设备及存储介质。

技术介绍

[0002]关系抽取是自然语言处理领域的一项基本且重要的任务。同时,关系抽取也是信息抽取中一项基本任务之一。信息抽取指的从非结构化或半结构化文本中提取关键信息,并整合为结构化信息的一项技术。从字面上理解来说,关系抽取就是识别实体与实体的关系。关系抽取主要负责从文本中识别出实体,抽取实体间的语义关系。
[0003]通常,人们会从一段新闻或者文字中获取自己需要的,并且重要的信息以及它们之间存在的关系,所以这个时候,关系抽取就显得十分重要,它能帮助我们很快的从文本中检索出我们需要的关键信息,而且能够识别出它们之间的依赖关系。这对于工业文件的数据挖掘和知识发现研究的展开也有着重要意义和研究价值。
[0004]目前,公司对外采购空调相关的物料时,完全依赖人工拆解接线图纸形成核价BOM表(Bill of Material,物料清单),此过程依赖大量人工作业,耗时耗力。所以,需要利用人工智能的语义分析本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关系抽取的方法,其特征在于,包括:获取与空调相关的至少两个待识别的文本;对各个所述待识别的文本进行语义编码,得到与所述待识别的文本各自对应的词向量;基于各个词向量,提取各个所述待识别的文本之间的依赖关系。2.根据权利要求1所述的关系抽取的方法,其特征在于,所述对各个所述待识别的文本进行语义编码,得到与所述待识别的文本各自对应的词向量,包括:将各个所述待识别的文本输入到预先训练好的ELMo模型中,利用所述ELMo模型对各个所述待识别的文本进行语义编码,得到每个所述待识别的文本各自的词向量。3.根据权利要求2所述的关系抽取方法,其特征在于,所述基于各个词向量,提取各个所述待识别的文本之间的依赖关系,包括:将各个所述词向量,输入到预先训练好的深度金字塔卷积神经网络模型中,提取各个所述待识别的文本之间的依赖关系。4.根据权利要求1~3任意一项所述的关系抽取方法,其特征在于,所述依赖关系包括:配件从属关系、属性长度从属关系、属性管径从属关系、属性数量从属关系和主客从属关系中的至少一种。5.根据权利要求3所述的关系抽取方法,其特征在于,所述将各个所述待识别的文本输入到预先训练好的ELMo模型中之前,还包括:获取标注好的与空调相关的多个训练文本;利用所述训练文本,对初始ELMo模型进行训练,得到训练好的ELMo模型以及各个所述训练文本各自对应的目标词向量;利用各个所述目标词向量,对初始深度金字塔卷积神经网络模型进行训练,得到训练好的深度金字塔卷积神经网络模型。6.根据权利要求5所...

【专利技术属性】
技术研发人员:唐光远罗琴李润静陈海波熊琼张俊杰
申请(专利权)人:珠海联云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1