实体语义关系分类方法、模型训练方法、装置及电子设备制造方法及图纸

技术编号:21116628 阅读:23 留言:0更新日期:2019-05-16 09:15
本发明专利技术实施例提出了一种实体语义关系分类方法、模型训练方法、装置及电子设备,涉及文本识别技术领域,通过确定获得语料中的第一实体和第二实体,并根据语料中每个文字距离第一实体的第一位置距离和的距离第二实体的第二位置距离,获得每个文字对应的特征向量,进而将语料中所有文字各自的特征向量进行组合,得到语料对应的模型输入向量,从而将语料对应的模型输入向量作为实体语义关系分类模型的输入,得到该语料对应的实体语义关系,相比于现有技术,能够提升实体语义关系的分类准确率。

【技术实现步骤摘要】
实体语义关系分类方法、模型训练方法、装置及电子设备
本专利技术涉及文本识别
,具体而言,涉及一种实体语义关系分类方法、模型训练方法、装置及电子设备。
技术介绍
深度学习是机器学习中一种基于对数据进行表征学习的方法。在深度学习的实际应用中,通常需要预先训练出深度学习模型。训练深度学习模型所采用的样本数据通常包括多个维度的特征数据,根据训练数据集不断地对深度学习模型进行训练,得出更精确的预测模型,通过使用该预测模型对该深度学习模型进行更新,以使该预测模型用于在线执行数据预测操作。
技术实现思路
本专利技术的目的在于提供一种实体语义关系分类方法、模型训练方法、装置及电子设备,能够提升实体语义关系的分类准确率。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供了一种实体语义关系分类方法,应用于一电子设备,所述电子设备中预设有一实体语义关系分类模型,所述方法包括:确定出语料中的第一实体与第二实体;获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离;将所述语料中所有文字各自对应的特征向量进行组合,得到所述语料对应的模型输入向量,其中,每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;将所述语料对应的模型输入向量,作为所述预设的实体语义关系分类模型的输入,确定出所述第一实体与所述第二实体两者的实体语义关系类型。第二方面,本专利技术实施例提供了一种实体语义关系分类模型训练方法,应用于一电子设备,所述方法包括:接收至少一个训练样本,识别所述至少一个训练样本中每个训练样本的第一实体和第二实体;获得所述每个训练样本中每个文字各自与对应的所述第一实体的第一位置距离以及与对应的所述第二实体的第二位置距离;将所述每个训练样本中所有文字各自对应的特征向量进行组合,得到所述每个训练样本对应的模型输入向量,其中,每个文字对应的所述特征向量由所述每个训练样本中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入,以对所述实体语义关系分类模型进行训练。第三方面,本专利技术实施例提供了一种实体语义关系分类装置,应用于一电子设备,所述电子设备中预设有一实体语义关系分类模型,所述装置包括:第一处理模块,用于确定出语料中的第一实体与第二实体;所述第一处理模块还用于,获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离;识别模块,用于将所述语料中所有文字各自对应的特征向量进行组合,得到所述语料对应的模型输入向量,其中,每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量。第四方面,本专利技术实施例提供了一种实体语义关系分类模型训练装置,应用于一电子设备,所述装置包括:接收模块,用于接收至少一个训练样本,识别所述至少一个训练样本中每个训练样本的第一实体和第二实体;第二处理模块,用于获得所述每个训练样本中每个文字各自与对应的所述第一实体的第一位置距离以及与对应的所述第二实体的第二位置距离;所述第二处理模块还用于,将所述每个训练样本中所有文字各自对应的特征向量进行组合,得到所述每个训练样本对应的模型输入向量,其中,每个文字对应的所述特征向量由所述每个训练样本中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;训练模块,用于将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入,以对所述实体语义关系分类模型进行训练。第五方面,本专利技术实施例提供了一种电子设备,所述电子设备包括存储器,用于存储一个或多个程序;处理器。当所述一个或多个程序被所述处理器执行时,实现上述的实体语义关系分类方法或实体语义关系分类模型训练方法。第六方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的实体语义关系分类方法或实体语义关系分类模型训练方法。相对于现有技术,本专利技术实施例所提供的一种实体语义关系分类方法、模型训练方法、装置及电子设备,通过确定获得语料中的第一实体和第二实体,并根据语料中每个文字距离第一实体的第一位置距离和的距离第二实体的第二位置距离,获得每个文字对应的特征向量,进而将语料中所有文字各自的特征向量进行组合,得到语料对应的模型输入向量,从而将语料对应的模型输入向量作为实体语义关系分类模型的输入,得到该语料对应的实体语义关系,相比于现有技术,能够提升实体语义关系的分类准确率。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。图1为本专利技术一实施例所提供的一种电子设备的示意性结构框图;图2为一种实体语义关系分类模型的示意性结构图;图3为本专利技术一实施例所提供的一种实体语义关系分类模型训练方法的示意性流程图;图4为图3中S204的子步骤的一种示意性流程图;图5为图3中S204的子步骤的另一种示意性流程图;图6为本专利技术一实施例所提供的一种实体语义分类方法的示意性流程图;图7为图6中S303的子步骤的一种示意性流程图;图8为图7中S3031的子步骤的一种示意性流程图;图9为本专利技术一实施例所提供的一种实体语义关系分类模型训练装置的示意性结构图;图10为本专利技术一实施例提供的一种实体语义关系分类装置的示意性结构图。图中:100-电子设备;101-存储器;102-处理器;103-通信接口;400-实体语义关系分类模型训练装置;401-接收模块;402-第二处理模块;403-训练模块;500-实体语义关系分类装置;501-第一处理模块;502-识别模块。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。需要说明的是,在本文中,诸如第一和第二等之类的本文档来自技高网...

【技术保护点】
1.一种实体语义关系分类方法,其特征在于,应用于一电子设备,所述电子设备中预设有一实体语义关系分类模型,所述方法包括:确定出语料中的第一实体与第二实体;获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离;将所述语料中所有文字各自对应的特征向量进行组合,得到所述语料对应的模型输入向量,其中,每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;将所述语料对应的模型输入向量,作为所述预设的实体语义关系分类模型的输入,确定出所述第一实体与所述第二实体两者的实体语义关系类型。

【技术特征摘要】
1.一种实体语义关系分类方法,其特征在于,应用于一电子设备,所述电子设备中预设有一实体语义关系分类模型,所述方法包括:确定出语料中的第一实体与第二实体;获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离;将所述语料中所有文字各自对应的特征向量进行组合,得到所述语料对应的模型输入向量,其中,每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;将所述语料对应的模型输入向量,作为所述预设的实体语义关系分类模型的输入,确定出所述第一实体与所述第二实体两者的实体语义关系类型。2.如权利要求1所述的方法,其特征在于,将所述语料中所有文字各自对应的特征向量进行组合,得到所述语料对应的模型输入向量的步骤,包括:获得所述语料中每个文字对应的字向量,以及每个文字的第一位置距离与第二位置距离各自对应的第一位置嵌入向量和第二位置嵌入向量;将每个文字对应的字向量、第一位置嵌入向量和第二位置嵌入向量进行组合,获得每个文字对应的特征向量;将所述语料中所有文字各自对应的特征向量进行组合,获得所述语料对应的所述模型输入向量。3.如权利要求2所述的方法,其特征在于,获得每个文字的第一位置距离与第二位置距离各自对应的第一位置嵌入向量和第二位置嵌入向量的步骤,包括:获得位置嵌入向量表,其中,所述位置嵌入向量表记录有位置距离与位置嵌入向量的对应关系;在所述位置嵌入向量表中分别确定出所述第一位置距离和所述第二位置距离各自对应的所述第一位置嵌入向量和所述第二位置嵌入向量。4.如权利要求1所述的方法,其特征在于,所述实体语义关系分类模型为双向门控循环神经BiGRU+注意力Attention机制模型,所述语料为电子病历。5.一种实体语义关系分类模型训练方法,其特征在于,应用于一电子设备,所述方法包括:接收至少一个训练样本,识别所述至少一个训练样本中每个训练样本的第一实体和第二实体;获得所述每个训练样本中每个文字各自与对应的所述第一实体的第一位置距离以及与对应的所述第二实体的第二位置距离;将所述每个训练样本中所有文字各自对应的特征向量进行组合,得到所述每个训练样本对应的模型输入向量,其中,每个文字对应的所述特征向量由所述每个训练样本中每个文字对应的字向量与位置向量进行组合后获得,所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量;将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入,以对所述实体语义关系分类模型进行训练。6.如权利要求5所述的方法,其特征在于,将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入,以对所述实体语义关系分类模型进行训练的步骤,包括:获得所述每个训练样本通过所述实体语义关系分类模型训练后得到的所述第一实体与第二实体两者的实体语义关系类型;获得所述每个训练样本中所述实体语义关系类型和,为所述每个训练样本对应预先存储的所述第一实体和第二实体的实体语义关系类型的偏差值;获得所述每个训练样本的偏差值之和;当所述偏差值之和超过第一偏差阈值,则调整所述实体语义关系分类模型中的参数,以训练所述实体语义关系分类模型。7.如权利要求5所述的方法,其特征在于,将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入,以对所述实体语义关系分类模型进行训练的步骤,包括:获得所述每个训练样本通过所述实体语义关系分类模型训练后得到的所述第一实体与第二实体两者...

【专利技术属性】
技术研发人员:樊芳利
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1