训练实体识别和关系分类模型的方法、装置、设备及介质制造方法及图纸

技术编号:24169054 阅读:24 留言:0更新日期:2020-05-16 02:21
本申请提供了一种训练命名实体识别和关系分类模型的方法、装置、电子设备及存储介质,该方法包括:获得多个样本语料,每个样本语料携带命名实体标签和关系标签;将多个样本语料输入单词嵌入层,得到关系矩阵;将每个样本语料携带的命名实体标签的词向量输入LSTM编码层,得到每个样本语料携带的命名实体标签的上下文编码向量;将得到的上下文编码向量输入命名实体识别模块,对命名实体识别模块进行多次训练;将得到的上下文编码向量和词向量输入关系分类模块,对关系分类模块进行多次训练。通过训练得到的模型,可一次性提取命名实体和实体关系,有效整合命名实体和实体关系的信息,可实现命名实体之间的多关系重叠抽取,解决多对多关系抽取问题。

Methods, devices, equipment and media for training entity recognition and relation classification model

【技术实现步骤摘要】
训练实体识别和关系分类模型的方法、装置、设备及介质
本专利技术涉及自然语言处理
,特别是涉及一种训练命名实体识别和关系分类模型的方法、装置、电子设备及存储介质。
技术介绍
自然语言处理是一门多学科融合的科学,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。近年来随着网络信息量的增大,对海量数据命名实体关系识别变得越来越难,而如何利用海量数据来挖掘出更多的业务需求所需要的实体关系是目前亟待解决的技术难题,也是目前自然语言研究的一个重要方向。实体识别和关系识别是自然语言处理中的关键任务。传统的信息抽取采用串行模式处理,即:首先识别出实体,然后再识别出实体之间的关系。然而,该方法是建立在实体和实体关系相互独立的基础上的,具体地,将整体任务分离成子任务独立运行,虽然能实现实体和实体间关系的提取,但在本质上忽略了实体和实体关系之间的关联性,导致命名实体识别过程中会生成大量冗余信息,并产生误差累积,进而降低实体识别的准确率以及实体关系抽取的准确率。
技术实现思路
本申请实施例提供了一种训练命名实体识别和关本文档来自技高网...

【技术保护点】
1.一种训练命名实体识别和关系分类模型的方法,其特征在于,包括:/n获得多个样本语料,每个样本语料携带命名实体标签和关系标签;/n将所述多个样本语料输入所述命名实体识别和关系分类模型的单词嵌入层,得到关系矩阵,所述关系矩阵表征所述多个样本语料中每个样本语料携带的命名实体标签的词向量和关系标签;/n将所述多个样本语料中每个样本语料携带的命名实体标签的词向量输入LSTM编码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量;/n将所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量输入命名实体识别模块,根据所述多个样本语料中每个样本语料携带的命名实体标签,对所述命...

【技术特征摘要】
1.一种训练命名实体识别和关系分类模型的方法,其特征在于,包括:
获得多个样本语料,每个样本语料携带命名实体标签和关系标签;
将所述多个样本语料输入所述命名实体识别和关系分类模型的单词嵌入层,得到关系矩阵,所述关系矩阵表征所述多个样本语料中每个样本语料携带的命名实体标签的词向量和关系标签;
将所述多个样本语料中每个样本语料携带的命名实体标签的词向量输入LSTM编码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量;
将所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量输入命名实体识别模块,根据所述多个样本语料中每个样本语料携带的命名实体标签,对所述命名实体识别模块进行多次训练;
将所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量和词向量输入关系分类模块,根据所述多个样本语料中每个样本语料携带的关系标签,对所述关系分类模块进行多次训练;
经过多次训练后,得到命名实体识别和关系分类模型,所述命名实体识别和关系分类模型用于识别待识别语料包含的命名实体和命名实体之间的关系。


2.根据权利要求1所述的方法,其特征在于,在将所述多个样本语料输入所述命名实体识别和关系分类模型的单词嵌入层,得到关系矩阵之后,所述方法还包括:
采用基于SVD的降维算法,对所述关系矩阵进行奇异值分解,得到低维的关系矩阵。


3.根据权利要求1所述的方法,其特征在于,所述LSTM编码层包括前向LSTM编码层、后向LSTM编码层和连接层;将所述多个样本语料中每个样本语料携带的命名实体标签的词向量输入LSTM编码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量,包括:
将所述多个样本语料中每个样本语料携带的命名实体标签的词向量输入所述前向LSTM编码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上文编码向量;
将所述多个样本语料中每个样本语料携带的命名实体标签的词向量输入所述后向LSTM编码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的下文编码向量;
将所述多个样本语料中每个样本语料携带的命名实体标签的上文编码向量和下文编码向量输入所述连接层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量。


4.根据权利要求1所述的方法,其特征在于,所述命名实体识别模块包括LSTM解码层和第一softmax层;将所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量输入命名实体识别模块,根据所述多个样本语料中每个样本语料携带的命名实体标签,对所述命名实体识别模块进行多次训练,包括:
将所述多个样本语料中每个样本语料携带的命名实体标签的上下文编码向量输入所述LSTM解码层,得到所述多个样本语料中每个样本语料携带的命名实体标签的上下文解码向量;
采用条件随机场CRF中的特征函数,对所述多个样本语料中每个样本语料携带的命名实体标签的上下文解码向量进行处理,并将处理后得到的结果输入所述第一sofmax层,获得所述第一sofmax层输出...

【专利技术属性】
技术研发人员:刘嘉庆喻波王志海魏力谢福进
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1