文本情感识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号:34567191 阅读:14 留言:0更新日期:2022-08-17 12:57
本发明专利技术提供一种文本情感识别方法及装置、电子设备、存储介质,本发明专利技术提供一种文本情感识别方法,包括:获取样本数据;对样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;通过对样本数据集进行语法层次排序和上下文编码,建立第一网络模型;根据第一网络模型的输出结果和分类处理结果,建立第二网络模型,并对第二网络模型进行训练,以得到文本情感识别模型,文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型;将待识别文本数据输入至文本情感识别模型,得到待识别文本数据的文本情感识别结果。能够获取更加丰富的文本特征信息,极大提升了对文本数据情感识别的准确性。极大提升了对文本数据情感识别的准确性。极大提升了对文本数据情感识别的准确性。

【技术实现步骤摘要】
文本情感识别方法及装置、电子设备、存储介质


[0001]本申请涉及文本情感分类
,具体涉及一种文本情感识别方法及装置、电子设备、存储介质。

技术介绍

[0002]近年来,智能客服系统已经侵入到人们生活的方方面面,网购退换货、手机换套餐、用户投诉等所有能想到的客服场景,背后都有了智能客服的影子。为了让智能客服更好的为用户服务,使其生成的回复更加人性化,用户的情绪状态是重要的参考指标,因此通过用户输入的文本对其情感状态进行分析就显得尤为重要。
[0003]在智能客服领域,用户输入的文本都是句子级别的,很少有大篇幅的文本出现,因此其包含信息少,加之自然语言表达多样,同一个词在不同语境下表达的情感也可能不一样,等等难点都导致了想要精准的对短文本进行情感分类比较困难。
[0004]情感分类任务,在早期的时候,人们大多采用传统机器学习的方法,然而这些方法极其依赖特征工程,导致费时费力,不仅需要大量的领域知识,且鲁棒能力差,极易产生过拟合的现象。随着深度学习的发展,其不需要人为设计特征,可以自动学习提取特征,使其开始成为主流。研究员开始利用深度学习的各种网络结构来解决情感分类问题,并取得了一定的成果,但仍然存在一些问题。比如现在的网络结构利用如LSTM(Long Short

Term Memory,长短期记忆网络)或transformer(多头注意力机制)等结构可以很好的进行上下文编码,但仍不能挖掘更深层次的内在联系,如句法结构这类联系。句法结构对理解句子的语义有重要作用。因为语言虽然看起来是一个序列,实际上却具有复杂的层次结构,即便相同的序列,不同的内部层次结构也会带来语义的差别。虽然我们可以使用句法分析工具或训练一个模型分析句子的层次结构后再作为特征输入至情感分类模型中,但是模型的割裂会带来一定的不稳定性。因此,需要提供一种文本情感识别方法及装置、电子设备、存储介质。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术提供一种文本情感识别方法及装置、电子设备、存储介质,以解决上述技术问题。
[0006]本专利技术提供的文本情感识别方法,包括:
[0007]获取样本数据;
[0008]对所述样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;
[0009]通过对所述样本数据集进行语法层次排序和上下文编码,建立第一网络模型;
[0010]根据第一网络模型的输出结果和所述分类处理结果,建立第二网络模型,并对所述第二网络模型进行训练,以得到文本情感识别模型,所述文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型;
[0011]将待识别文本数据输入至文本情感识别模型,得到待识别文本数据的文本情感识
别结果。
[0012]与本专利技术的一实施例中,所述获取样本数据之后,还包括对所述样本数据进行预处理,所述预处理包括以下过程:
[0013]将所述样本数据进行文本标准化处理,获得标准化样本数据,其中,所述文本标准化处理包括数字归一化、英文大小写统一化、字符编码标准化和/或中文繁简体统一化;
[0014]对所述标准化样本数据进行文本清洗,去除非文本内容,获得清洗后样本数据;
[0015]对所述清洗后样本数据进行文本纠错,获得预处理后样本数据。
[0016]与本专利技术的一实施例中,所述将待识别文本数据输入至文本情感识别模型,得到待识别文本数据的文本情感识别结果,包括:
[0017]将待识别文本数据输入至所述文本情感识别模型,通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息,构建语句特征矩阵;
[0018]将所述语句特征矩阵输入至所述第二网络模型,获得所述待识别文本数据属于预设的各情感类别的概率值,并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果。
[0019]与本专利技术的一实施例中,所述第一网络模型为有序长短期记忆网络,所述第二网络模型为多头自注意力机制网络。
[0020]与本专利技术的一实施例中,所述将待识别文本数据输入至所述文本情感识别模型,通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息,构建语句特征矩阵,包括:
[0021]将所述待识别文本数据转化为特征矩阵;
[0022]将所述特征矩阵输入至所述第二网络模型,提取所述特征矩阵中的层级信息,获得语句特征矩阵。
[0023]与本专利技术的一实施例中,所述将所述语句特征矩阵输入至所述第二网络模型,获得所述待识别文本数据属于预设的各情感类别的概率值,并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果,包括:
[0024]根据预设的注意力机制运算,对输入至所述第二网络模型的所述语句特征矩阵进行处理,得到获得注意力矩阵;
[0025]通过设置注意力矩阵的多跳连接,获取所述第二网络模型的最后一层注意力层输出的注意力矩阵;
[0026]将所述最后一层注意力层输出的注意力矩阵中的各特征进行分类,并将分类结果与各标签进行匹配处理,根据文本情感类别的匹配率,得到样本数据的分类结果。
[0027]与本专利技术的一实施例中,所述将所述语句特征矩阵输入至所述第二网络模型,按照预设的注意力机制运算,获得注意力矩阵,包括:
[0028]将所述语句特征矩阵分别与所述第二网络模型中当前头的预设的查询向量权重矩阵、键向量权重矩阵、值向量权重矩阵进行点乘,获得查询向量矩阵、键向量矩阵和值向量矩阵,构建当前头的句向量特征矩阵;
[0029]对各头的句向量特征矩阵进行拼接处理,得到拼接后特征矩阵;
[0030]通过对拼接后特征矩阵与所述语句特征矩阵进行求和及归一化处理,获得注意力矩阵。
[0031]与本专利技术的一实施例中,所述文本情感识别模型是由所述第一网络模型与所述第二网络模型联合训练得到,所述文本情感识别模型的获得包括:将所述第一网络模型的输出结果输入至所述第二网络模型,得到样本数据集中各样本数据的分类结果,并基于分类结果和样本数据的标签,联合训练所述第一网络模型和所述第二网络模型,根据分类结果更新所述文本情感识别模型的参数,得到训练好的文本情感识别模型。
[0032]与本专利技术的一实施例中,所述根据分类结果更新所述文本情感识别模型的参数,包括:
[0033]获取所述文本情感识别模型的当前参数值;
[0034]根据预设的参数更新规则,获得所述分类结果的损失值,根据所述损失值和当前参数值得到新的参数值。
[0035]与本专利技术的一实施例中,还提供一种文本情感识别装置,所述装置包括:
[0036]样本数据获取模块,配置为获取样本数据;
[0037]样本数据集制作模块,配置为对所述样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;
[0038]第一网络模型构建模块,配置为通过对所述样本数据集进行语法层次排序和上下文编码,建立本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本情感识别方法,其特征在于,包括以下过程:获取样本数据;对所述样本数据进行标注,并根据情感类别对标注后的样本数据进行分类处理,以得到样本数据集;通过对所述样本数据集进行语法层次排序和上下文编码,建立第一网络模型;根据第一网络模型的输出结果和所述分类处理结果,建立第二网络模型,并对所述第二网络模型进行训练,以得到文本情感识别模型,所述文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型;将待识别文本数据输入至所述文本情感识别模型,得到待识别文本数据的文本情感识别结果。2.根据权利要求1所述的文本情感识别方法,其特征在于,所述获取样本数据之后,还包括对所述样本数据进行预处理,所述预处理包括以下过程:将所述样本数据进行文本标准化处理,获得标准化样本数据,其中,所述文本标准化处理包括数字归一化、英文大小写统一化、字符编码标准化和/或中文繁简体统一化;对所述标准化样本数据进行文本清洗,去除非文本内容,获得清洗后样本数据;对所述清洗后样本数据进行文本纠错,获得预处理后样本数据。3.根据权利要求1所述的文本情感识别方法,其特征在于,所述第一网络模型为有序长短期记忆网络,所述第二网络模型为多头自注意力机制网络。4.根据权利要求3所述的文本情感识别方法,其特征在于,所述将待识别文本数据输入至所述文本情感识别模型,得到待识别文本数据的文本情感识别结果,包括:将待识别文本数据输入至所述文本情感识别模型,通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息,构建语句特征矩阵;将所述语句特征矩阵输入至所述第二网络模型,获得所述待识别文本数据属于预设的各情感类别的概率值,并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果。5.根据权利要求4所述的文本情感识别方法,其特征在于,所述将待识别文本数据输入至所述文本情感识别模型,通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息,构建语句特征矩阵,包括:将所述待识别文本数据转化为特征矩阵;将所述特征矩阵输入至所述第二网络模型,提取所述特征矩阵中的层级信息,获得语句特征矩阵。6.根据权利要求4所述的文本情感识别方法,其特征在于,所述将所述语句特征矩阵输入至所述第二网络模型,获得所述待识别文本数据属于预设的各情感类别的概率值,并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果,包括:根据预设的注意力机制运算,对输入至所述第二网络模型的所述语句特征矩阵进行处理,得到获得注意力矩阵;通过设置注意力矩阵的多跳连接,获取所述第二网络模型的最后一层注意力层输出的注意力矩阵;将所述最后一层注意力层输出的注意力矩阵中的各特...

【专利技术属性】
技术研发人员:杨稷
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1