实体语义关系分类方法、模型训练方法、装置及电子设备制造方法及图纸

技术编号：21116628 阅读：23 留言：0更新日期：2019-05-16 09:15

本发明专利技术实施例提出了一种实体语义关系分类方法、模型训练方法、装置及电子设备，涉及文本识别技术领域，通过确定获得语料中的第一实体和第二实体，并根据语料中每个文字距离第一实体的第一位置距离和的距离第二实体的第二位置距离，获得每个文字对应的特征向量，进而将语料中所有文字各自的特征向量进行组合，得到语料对应的模型输入向量，从而将语料对应的模型输入向量作为实体语义关系分类模型的输入，得到该语料对应的实体语义关系，相比于现有技术，能够提升实体语义关系的分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】
实体语义关系分类方法、模型训练方法、装置及电子设备
本专利技术涉及文本识别
，具体而言，涉及一种实体语义关系分类方法、模型训练方法、装置及电子设备。
技术介绍
深度学习是机器学习中一种基于对数据进行表征学习的方法。在深度学习的实际应用中，通常需要预先训练出深度学习模型。训练深度学习模型所采用的样本数据通常包括多个维度的特征数据，根据训练数据集不断地对深度学习模型进行训练，得出更精确的预测模型，通过使用该预测模型对该深度学习模型进行更新，以使该预测模型用于在线执行数据预测操作。
技术实现思路
本专利技术的目的在于提供一种实体语义关系分类方法、模型训练方法、装置及电子设备，能够提升实体语义关系的分类准确率。为了实现上述目的，本专利技术实施例采用的技术方案如下：第一方面，本专利技术实施例提供了一种实体语义关系分类方法，应用于一电子设备，所述电子设备中预设有一实体语义关系分类模型，所述方法包括：确定出语料中的第一实体与第二实体；获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离；将所述语料中所有文字各自对应的特征向量进行组合，得到所述语料对应的模型输入向量，其中，每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得，所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量；将所述语料对应的模型输入向量，作为所述预设的实体语义关系分类模型的输入，确定出所述第一实体与所述第二实体两者的实体语义关系类型。第二方面，本专利技术实施例提供了一种实体语义关系分类模型训练方法，应用于一电子设备，所述方...

【技术保护点】
1.一种实体语义关系分类方法，其特征在于，应用于一电子设备，所述电子设备中预设有一实体语义关系分类模型，所述方法包括：确定出语料中的第一实体与第二实体；获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离；将所述语料中所有文字各自对应的特征向量进行组合，得到所述语料对应的模型输入向量，其中，每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得，所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量；将所述语料对应的模型输入向量，作为所述预设的实体语义关系分类模型的输入，确定出所述第一实体与所述第二实体两者的实体语义关系类型。

【技术特征摘要】
1.一种实体语义关系分类方法，其特征在于，应用于一电子设备，所述电子设备中预设有一实体语义关系分类模型，所述方法包括：确定出语料中的第一实体与第二实体；获得所述语料中每个文字各自与所述第一实体的第一位置距离以及与所述第二实体的第二位置距离；将所述语料中所有文字各自对应的特征向量进行组合，得到所述语料对应的模型输入向量，其中，每个文字对应的所述特征向量由所述语料中每个文字对应的字向量与位置向量进行组合后获得，所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量；将所述语料对应的模型输入向量，作为所述预设的实体语义关系分类模型的输入，确定出所述第一实体与所述第二实体两者的实体语义关系类型。2.如权利要求1所述的方法，其特征在于，将所述语料中所有文字各自对应的特征向量进行组合，得到所述语料对应的模型输入向量的步骤，包括：获得所述语料中每个文字对应的字向量，以及每个文字的第一位置距离与第二位置距离各自对应的第一位置嵌入向量和第二位置嵌入向量；将每个文字对应的字向量、第一位置嵌入向量和第二位置嵌入向量进行组合，获得每个文字对应的特征向量；将所述语料中所有文字各自对应的特征向量进行组合，获得所述语料对应的所述模型输入向量。3.如权利要求2所述的方法，其特征在于，获得每个文字的第一位置距离与第二位置距离各自对应的第一位置嵌入向量和第二位置嵌入向量的步骤，包括：获得位置嵌入向量表，其中，所述位置嵌入向量表记录有位置距离与位置嵌入向量的对应关系；在所述位置嵌入向量表中分别确定出所述第一位置距离和所述第二位置距离各自对应的所述第一位置嵌入向量和所述第二位置嵌入向量。4.如权利要求1所述的方法，其特征在于，所述实体语义关系分类模型为双向门控循环神经BiGRU+注意力Attention机制模型，所述语料为电子病历。5.一种实体语义关系分类模型训练方法，其特征在于，应用于一电子设备，所述方法包括：接收至少一个训练样本，识别所述至少一个训练样本中每个训练样本的第一实体和第二实体；获得所述每个训练样本中每个文字各自与对应的所述第一实体的第一位置距离以及与对应的所述第二实体的第二位置距离；将所述每个训练样本中所有文字各自对应的特征向量进行组合，得到所述每个训练样本对应的模型输入向量，其中，每个文字对应的所述特征向量由所述每个训练样本中每个文字对应的字向量与位置向量进行组合后获得，所述位置向量包括每个文字的第一位置距离和第二位置距离分别对应的向量；将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入，以对所述实体语义关系分类模型进行训练。6.如权利要求5所述的方法，其特征在于，将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入，以对所述实体语义关系分类模型进行训练的步骤，包括：获得所述每个训练样本通过所述实体语义关系分类模型训练后得到的所述第一实体与第二实体两者的实体语义关系类型；获得所述每个训练样本中所述实体语义关系类型和，为所述每个训练样本对应预先存储的所述第一实体和第二实体的实体语义关系类型的偏差值；获得所述每个训练样本的偏差值之和；当所述偏差值之和超过第一偏差阈值，则调整所述实体语义关系分类模型中的参数，以训练所述实体语义关系分类模型。7.如权利要求5所述的方法，其特征在于，将所述每个训练样本各自对应的模型输入向量作为所述实体语义关系分类模型的输入，以对所述实体语义关系分类模型进行训练的步骤，包括：获得所述每个训练样本通过所述实体语义关系分类模型训练后得到的所述第一实体与第二实体两者...

【专利技术属性】
技术研发人员：樊芳利，
申请(专利权)人：新华三大数据技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人