信息抽取、模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:30964444 阅读:7 留言:0更新日期:2021-11-25 20:31
本申请涉及一种信息抽取、模型训练方法、装置、计算机设备和存储介质,通过将客服对话语音信号所对应的待预测文本数据输入至信息抽取模型,通过所述词嵌入层对所述待预测文本数据进行嵌入表征,得到所述待预测文本数据的词向量;通过所述特征增强层对所述词向量进行维度变化,将维度变化后的词向量分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述待预测文本数据中的实体类信息和关键词信息,实现将信息抽取拆解为命名实体识别与关键词抽取两个子任务,从而减少信息抽取任务的难度,并提升关键信息抽取的准确率,降低关键词漏检几率。降低关键词漏检几率。降低关键词漏检几率。

【技术实现步骤摘要】
信息抽取、模型训练方法、装置、计算机设备和存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种信息抽取、模型训练方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着自然语言处理技术的飞速发展,许多先进的人工智能技术逐步落地,应用于实际生产中。在电话银行场景中,应用最为广泛的便是关键信息提取(Information Extration)方法。获取电话银行对话过程中的语音数据,识别该语音数据对应的文本内容,通过机器学习模型从文本内容中抽取关键信息,根据抽取到的关键信息感知客户意图与需求,并针对客户的需要作出回应服务。
[0003]然而,相关技术中的信息抽取方式会出现对关键词漏检的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够降低相关技术中关键词漏检几率的信息抽取、模型训练方法、装置、计算机设备和存储介质。
[0005]一种信息抽取方法,所述方法包括:
[0006]将客服对话语音信号所对应的待预测文本数据输入至信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;
[0007]通过所述词嵌入层对所述待预测文本数据进行嵌入表征,得到所述待预测文本数据的词向量;
[0008]通过所述特征增强层对所述词向量进行维度变化,将维度变化后的词向量分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述待预测文本数据中的实体类信息和关键词信息。
[0009]在其中一个实施例中,在所述信息抽取模型的训练阶段,所述特征增强层用于将样本文本数据的句法特征、词性特征与所述词嵌入层输出的词向量进行拼接。
[0010]在其中一个实施例中,所述命名实体识别模型包括依次连接的第一预训练词嵌入层、第一双向LSTM层、第一向量拼接层、第一全连接层和CRF解码层。
[0011]在其中一个实施例中,所述关键词提取模型包括依次连接的第二预训练词嵌入层、第二双向LSTM层、第二向量拼接层、注意力层和第二全连接层。
[0012]在其中一个实施例中,所述方法还包括:
[0013]获取输入的关键要素信息;
[0014]根据所述实体类信息和所述关键词信息,对所述关键要素信息进行校验。
[0015]在其中一个实施例中,所述方法还包括:
[0016]获取对校验结果的反馈信息;
[0017]根据所述反馈信息,利用所述待预测文本数据、所述实体类信息、所述关键词信息
继续对所述信息抽取模型进行训练,得到更新后的信息抽取模型。
[0018]一种模型训练方法,所述方法包括:
[0019]获取训练数据集,所述训练数据集包括若干个样本文本数据;
[0020]将所述样本文本数据输入至待训练的信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;
[0021]通过所述词嵌入层对所述样本文本数据进行嵌入表征,得到所述样本文本数据的词向量;
[0022]获取所述样本文本数据的句法特征、词性特征,通过所述特征增强层将所述句法特征、所述词性特征与所述词向量进行拼接,得到拼接特征;
[0023]将所述拼接特征分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述样本文本数据中的实体类信息和关键词信息;
[0024]当所述样本文本数据中的实体类信息和关键词信息满足模型训练停止条件时,停止对所述信息抽取模型的训练。
[0025]在其中一个实施例中,所述词嵌入层采用Bert网络模型,在所述将所述样本文本数据输入至待训练的信息抽取模型之前,所述方法还包括:
[0026]获取金融领域文本数据,所述金融领域数据包括若干个金融领域词汇;
[0027]基于全词掩码对所述金融领域词汇进行词覆盖处理,利用处理后的金融领域文本数据对所述Bert网络模型进行无监督预训练。
[0028]一种信息抽取装置,所述装置包括:
[0029]文本数据输入模块,用于将客服对话语音信号所对应的待预测文本数据输入至信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;
[0030]文本数据嵌入模块,用于通过所述词嵌入层对所述待预测文本数据进行嵌入表征,得到所述待预测文本数据的词向量;
[0031]实体关键词抽取模块,用于通过所述特征增强层对所述词向量进行维度变化,将维度变化后的词向量分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述待预测文本数据中的实体类信息和关键词信息。
[0032]一种模型训练装置,所述装置包括:
[0033]数据集获取模块,用于获取训练数据集,所述训练数据集包括若干个样本文本数据;
[0034]文本数据输入模块,用于将所述样本文本数据输入至待训练的信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;
[0035]文本数据嵌入模块,用于通过所述词嵌入层对所述样本文本数据进行嵌入表征,得到所述样本文本数据的词向量;
[0036]文本特征增强模块,用于获取所述样本文本数据的句法特征、词性特征,通过所述特征增强层将所述句法特征、所述词性特征与所述词向量进行拼接,得到拼接特征;
[0037]实体关键词抽取模块,用于将所述拼接特征分别输入至所述命名实体识别模型和
所述关键词提取模型中进行信息抽取,得到所述样本文本数据中的实体类信息和关键词信息;
[0038]模型停止训练模块,用于当所述样本文本数据中的实体类信息和关键词信息满足模型训练停止条件时,停止对所述信息抽取模型的训练。
[0039]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
[0040]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0041]上述信息抽取、模型训练方法、装置、计算机设备和存储介质,通过将客服对话语音信号所对应的待预测文本数据输入至信息抽取模型,通过所述词嵌入层对所述待预测文本数据进行嵌入表征,得到所述待预测文本数据的词向量;通过所述特征增强层对所述词向量进行维度变化,将维度变化后的词向量分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述待预测文本数据中的实体类信息和关键词信息,实现将信息抽取拆解为命名实体识别与关键词抽取两个子任务,从而减少信息抽取任务的难度,并提升关键信息抽取的准确率,降低关键词漏检几率。
附图说明
[0042]图1为一个实施例中信息抽取方法的应用环境图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息抽取方法,其特征在于,所述方法包括:将客服对话语音信号所对应的待预测文本数据输入至信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;通过所述词嵌入层对所述待预测文本数据进行嵌入表征,得到所述待预测文本数据的词向量;通过所述特征增强层对所述词向量进行维度变化,将维度变化后的词向量分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述待预测文本数据中的实体类信息和关键词信息。2.根据权利要求1所述的方法,其特征在于,在所述信息抽取模型的训练阶段,所述特征增强层用于将样本文本数据的句法特征、词性特征与所述词嵌入层输出的词向量进行拼接。3.根据权利要求1所述的方法,其特征在于,所述命名实体识别模型包括依次连接的第一预训练词嵌入层、第一双向LSTM层、第一向量拼接层、第一全连接层和CRF解码层。4.根据权利要求1所述的方法,其特征在于,所述关键词提取模型包括依次连接的第二预训练词嵌入层、第二双向LSTM层、第二向量拼接层、注意力层和第二全连接层。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述方法还包括:获取输入的关键要素信息;根据所述实体类信息和所述关键词信息,对所述关键要素信息进行校验。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取对校验结果的反馈信息;根据所述反馈信息,利用所述待预测文本数据、所述实体类信息、所述关键词信息继续对所述信息抽取模型进行训练,得到更新后的信息抽取模型。7.一种模型训练方法,其特征在于,所述方法包括:获取训练数据集,所述训练数据集包括若干个样本文本数据;将所述样本文本数据输入至待训练的信息抽取模型,所述信息抽取模型包括词嵌入层、与所述词嵌入层连接的特征增强层、与所述特征增强层连接的命名实体识别模型和关键词提取模型;通过所述词嵌入层对所述样本文本数据进行嵌入表征,得到所述样本文本数据的词向量;获取所述样本文本数据的句法特征、词性特征,通过所述特征增强层将所述句法特征、所述词性特征与所述词向量进行拼接,得到拼接特征;将所述拼接特征分别输入至所述命名实体识别模型和所述关键词提取模型中进行信息抽取,得到所述样本文本数据中的实体类信息和关键词信息;当所述样本文本数据中的实体类信息和关键词信息满足模型训练停止条件时,停止对所述信息抽取模型的训练。...

【专利技术属性】
技术研发人员:张辰昱潘仰耀汪贇张彤刘学源
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1