语义识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:22076128 阅读:18 留言:0更新日期:2019-09-12 14:16
本申请公开了一种语义识别方法及装置、存储介质、计算机设备,涉及本文处理技术领域,可以提升语义识别效率。其中方法包括:利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量;利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体;利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。本申请适用于保险产品业务中的客服智能问答。

Semantic Recognition Method and Device, Storage Media and Computer Equipment

【技术实现步骤摘要】
语义识别方法及装置、存储介质、计算机设备
本申请涉及本文处理
,尤其是涉及到语义识别方法及装置、存储介质及计算机设备。
技术介绍
随着科学技术的发展,对于一些词语和词语之间的关系识别方法越来越多,所适用的场景也越来越广泛,例如一些地名之间的上下关系,国家机构之间的层级关系,物品种类的包含关系等,而这些需要各自独立的识别模型分别来实现词语(即,命名实体)的识别以及词语和词语之间的关系(即,实体关系)识别。现有技术存在的不足为,上述用于实现命名实体识别和实体关系识别的两种独立的识别模型在联合使用的过程中,彼此之间容易存在信息冗余的问题,目前的解决方法也仅局限于基于循环神经网络将上述两种独立的识别模型进行部分的联合,以提升网络模型的计算速率,从而提升命名实体识别和实体关系识别的效率,但提升效果较弱。
技术实现思路
有鉴于此,本申请提供了语义识别方法及装置、存储介质、计算机设备,主要目的在于解决现有用于命名实体识别和实体关系识别的两种独立的识别模型在联合使用的过程中,彼此之间容易存在信息冗余,以及所采用的网络模型的计算速率较低的问题。根据本申请的一个方面,提供了一种语义识别方法,该方法包括:利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量;利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体;利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。根据本申请的另一方面,提供了一种语义识别装置,该装置包括:第一卷积神经网络模块,用于利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量;第二卷积神经网络模块,用于利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体;第三卷积神经网络模块,用于利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述语义识别方法。依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述语义识别方法。借由上述技术方案,本申请提供的语义识别方法及装置、存储介质、计算机设备,与现有基于循环神经网络将用于命名实体识别和实体关系识别的两种独立的识别模型进行部分联合的技术方案相比,本申请利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量,利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体,以及利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。可见,通过利用语义识别模型中的多层卷积神经网络实现对命名实体和实体关系的识别,能够有效避免现有两种独立的识别模型在联合使用过程中造成的信息冗余问题,从而有效提升语义识别效率。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1示出了本申请实施例提供的一种语义识别方法的流程示意图;图2示出了本申请实施例提供的另一种语义识别方法的流程示意图;图3示出了本申请实施例提供的一种语义识别装置的结构示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。针对现有用于实现命名实体识别和实体关系识别的两种独立的识别模型在联合使用的过程中,彼此之间容易存在信息冗余,以及所采用的网络模型的计算速率较低的问题。本实施例提供了一种语义识别方法,能够有效避免现有两种独立的识别模型在联合使用过程中造成的信息冗余问题,从而有效提升语义识别效率,如图1所示,该方法包括:101、利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量。获取待识别文本,对获取到的待识别文本进行预处理,得到初始化的文本向量,并将初始化的文本向量输入语义识别模型预设的第一卷积神经网络,生成用于表征待识别文本的文本向量。其中,预处理可以根据实际的应用场景进行具体设定,例如设定该预处理为分词处理,即以词语为单位对待识别文本进行分词标记;或者设定该预处理为词语筛选处理,即以词语为单位对待识别文本进行分词标记后,剔除不重要的词语,例如,“能够、应该”等助动词,以及“喔、啊”等感叹词等不重要的词语,以提升对待识别文本的语义识别效率,此处不对预处理进行具体限定。其中,以设定该预处理为分词处理为例,对待识别文本进行分词处理具体为,利用SBME标记法对待识别文本中的词语分别进行标记,即将单字标记为S,词的首部标记为B,词的中部标记为M,词的尾部标记为E,并根据标记后的待识别文本生成初始化的文本向量。在对待识别文本进行语义识别之前构建本申请的语义识别模型,并获取用于训练该语义识别模型的训练样本集,即该训练样本集能够用于训练初始化的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络,从而得到语义识别模型。该训练样本集包括多个词组语料,词组语料为短句格式,即以逗号划分为一个短句,具体为,每个词组语料中包括两个具有相互关系的词语,例如,“中国、上海”,并在每个词组语料中标记两个词语之间的关系,例如,对“中国、上海”标记词语之间的关系为上下关系,从而构建训练样本集。此外,还可以对上述多个词组语料中的每个词语标记对应的词语属性,例如,将“中国、上海”中的中国和上海分别标记为地名,或者“犬科、狗”中的犬科和狗分别标记为动物。在实际应用过程中,词组语料中两个词语之间的关系可以进行多种设定,例如,标记“版权局、商标局”之间的关系为并列关系,标记“版权局、商标局”中的版权局和商标局的词语属性为国家机构;标记“犬科、狗”之间的关系为包含关系,标记“犬科、狗”中的犬科和狗的词语属性为动物等,此处不对相互关系进行具体限定。102、利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体。预设的第二卷积神经网络用于识别待识别文本中包含的命名实体,将预设的第一卷积神经网络的输出结果作为预设的第二卷积神经网络的输入,输入预设的第二卷积神经网络,输出结果即待识别文本中包含的命名实体。其中,待识别文本中包含的命名实体可以为多个,即待识别文本中包括多个词语,针对每个词语对应输出一个命名实体或者命名实体类别,命名实体类别包括人名、地名、机构名、产品名、专有名词等命名实体类别。103、利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。预设的第三卷积神经网络用于识别待识别文本中包含的实体关系,将预设的第一卷积神经网络的输出结果和预设的第二卷积神经网络的输出结果作为预设的第三卷积神经网本文档来自技高网...

【技术保护点】
1.一种语义识别方法,其特征在于,包括:利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量;利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体;利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。

【技术特征摘要】
1.一种语义识别方法,其特征在于,包括:利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量;利用语义识别模型中预设的第二卷积神经网络,根据所获取的文本向量确定待识别文本中的命名实体;利用语义识别模型中预设的第三卷积神经网络,根据所获取的文本向量和所确定的命名实体,确定待识别文本中的实体关系。2.根据权利要求1所述的方法,其特征在于,利用语义识别模型中预设的第一卷积神经网络获取待识别文本的文本向量,具体包括:利用字词向量词典获取待识别文本的字向量和词向量;对得到的字向量和词向量进行卷积运算,得到待识别文本的文本向量。3.根据权利要求1所述的方法,其特征在于,具体还包括:根据初始化的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络,分别确定第一损失函数、第二损失函数和第三损失函数;根据所确定的第一损失函数、第二损失函数和第三损失函数,对初始化的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络进行训练,得到预设的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络。4.根据权利要求3所述的方法,其特征在于,根据所确定的第一损失函数、第二损失函数和第三损失函数,得到预设的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络,具体包括:根据所确定的第一损失函数、第二损失函数和第三损失函数,确定所述语义识别模型的损失函数;利用所述语义识别模型的损失函数训练初始化的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络,得到预设的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络。5.根据权利要求1所述的方法,其特征在于,利用语义识别...

【专利技术属性】
技术研发人员:金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1