实体关系识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号：22565176 阅读：19 留言：0更新日期：2019-11-16 12:03

本申请公开了实体关系识别方法及装置、存储介质、计算机设备，涉及信息处理技术领域，能够有效提升对实体关系的识别准确度。其中方法包括：利用预设的第一实体关系识别模型，根据获取到的待识别文本得到待识别文本的文本向量；根据待识别文本的文本向量得到所述文本向量的卷积运算结果；根据所述文本向量和得到的卷积运算结果，确定待识别文本中包含的实体关系；其中，所述预设的第一实体关系识别模型是基于可信训练样本集训练得到的。本申请适用于文本实体关系的识别。

Entity relationship identification method and device, storage medium and computer equipment

The application discloses entity relationship recognition method and device, storage medium and computer equipment, which relate to the field of information processing technology and can effectively improve the recognition accuracy of entity relationship. The method includes: using the preset first entity relation recognition model, obtaining the text vector of the text to be recognized according to the acquired text to be recognized; obtaining the convolution operation result of the text vector according to the text vector to be recognized; determining the entity relation contained in the text to be recognized according to the text vector and the convolution operation result obtained; and The first entity relationship recognition model is based on the training of trusted training sample set. This application is applicable to the identification of text entity relationship.

全部详细技术资料下载

【技术实现步骤摘要】
实体关系识别方法及装置、存储介质、计算机设备
本申请涉及信息处理
，尤其是涉及到实体关系识别方法及装置、存储介质及计算机设备。
技术介绍
随着科学技术的发展，对于一些词语和词语之间的关系识别方法越来越多，所适用的场景也越来越广泛，例如一些地名之间的上下关系，国家机构之间的层级关系，物品种类的包含关系等，而这些需要利用大量的样本数据对神经网络进行训练，进而建立相应的识别模型以实现对文本中词语和词语之间的关系(即，实体关系)的抽取。现有技术存在的不足为，基于远程监督能够有效构建训练样本集以便实现对识别模型的训练，但训练样本集在构建的过程中还是容易混入错误的训练样本，对后期训练得到的识别模型的识别精度影响较大，从而导致训练后的识别模型对文本抽取实体关系的准确率较低，影响用户的使用体验。
技术实现思路
有鉴于此，本申请提供了实体关系识别方法及装置、存储介质、计算机设备，主要目的在于解决目前基于远程监督构建训练样本时容易混入错误的训练样本，从而导致训练后的识别模型对文本抽取实体关系的准确率较低的技术问题。根据本申请的一个方面，提供了一种实体关系识别方法，该方法包括：利用预设的第一实体关系识别模型，根据获取到的待识别文本得到待识别文本的文本向量；根据待识别文本的文本向量得到所述文本向量的卷积运算结果；根据所述文本向量和得到的卷积运算结果，确定待识别文本中包含的实体关系；其中，所述预设的第一实体关系识别模型是基于可信训练样本集训练得到的。根据...

【技术保护点】
1.一种实体关系识别方法，其特征在于，包括：/n利用预设的第一实体关系识别模型，根据获取到的待识别文本得到待识别文本的文本向量；/n根据待识别文本的文本向量得到所述文本向量的卷积运算结果；/n根据所述文本向量和得到的卷积运算结果，确定待识别文本中包含的实体关系；/n其中，所述预设的第一实体关系识别模型是基于可信训练样本集训练得到的，所述可信训练样本集是由带有实体关系标记的可信训练样本构建的。/n

【技术特征摘要】
1.一种实体关系识别方法，其特征在于，包括：
利用预设的第一实体关系识别模型，根据获取到的待识别文本得到待识别文本的文本向量；
根据待识别文本的文本向量得到所述文本向量的卷积运算结果；
根据所述文本向量和得到的卷积运算结果，确定待识别文本中包含的实体关系；
其中，所述预设的第一实体关系识别模型是基于可信训练样本集训练得到的，所述可信训练样本集是由带有实体关系标记的可信训练样本构建的。

2.根据权利要求1所述的方法，其特征在于，所述根据获取到的待识别文本得到待识别文本的文本向量，具体包括：
利用词向量词典获取待识别文本的字向量和词向量；
对得到的相邻多个字向量和词向量进行卷积运算，得到待识别文本的文本向量。

3.根据权利要求1所述的方法，其特征在于，所述可信训练样本集是由带有实体关系标记的可信训练样本构建的，具体包括：
利用预设的第二实体关系识别模型对远程监督训练样本进行实体关系预测；
根据实体关系预测结果和带有实体关系标记的标记训练样本，得到带有实体关系标记的可信训练样本。

4.根据权利要求3所述的方法，其特征在于，所述利用预设的第二实体关系识别模型对远程监督训练样本进行实体关系预测，具体包括：
利用预设的第二实体关系识别模型，对带有实体关系标记的标记训练样本进行卷积运算得到卷积运算结果；
根据所述卷积运算结果和所述标记训练样本中的实体关系标记，对初始化的高斯混合模型进行训练得到训练好的高斯混合模型；
利用训练好的高斯混合模型，对所述远程监督训练样本进行实体关系预测。

5.根据权利要求3或4所述的方法，其特征在于，所述根据实体关系预测结果和带有实体关系标记的标记训练样本，得到带有实体关系标记的可信训练样本，具体包括：
若预测得到的远程监督训练样本的实体关系与所述远程监督训练样本的初始实体关系标记一致，则将所述远程监督训练样本和所述标记训练样本作为带有实体关系标记的可信训练样本；...

【专利技术属性】
技术研发人员：肖京，徐亮，金戈，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人