文本情感识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号：34567191 阅读：14 留言：0更新日期：2022-08-17 12:57

本发明专利技术提供一种文本情感识别方法及装置、电子设备、存储介质，本发明专利技术提供一种文本情感识别方法，包括：获取样本数据；对样本数据进行标注，并根据情感类别对标注后的样本数据进行分类处理，以得到样本数据集；通过对样本数据集进行语法层次排序和上下文编码，建立第一网络模型；根据第一网络模型的输出结果和分类处理结果，建立第二网络模型，并对第二网络模型进行训练，以得到文本情感识别模型，文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型；将待识别文本数据输入至文本情感识别模型，得到待识别文本数据的文本情感识别结果。能够获取更加丰富的文本特征信息，极大提升了对文本数据情感识别的准确性。极大提升了对文本数据情感识别的准确性。极大提升了对文本数据情感识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本情感识别方法及装置、电子设备、存储介质

[0001]本申请涉及文本情感分类
，具体涉及一种文本情感识别方法及装置、电子设备、存储介质。

技术介绍

[0002]近年来，智能客服系统已经侵入到人们生活的方方面面，网购退换货、手机换套餐、用户投诉等所有能想到的客服场景，背后都有了智能客服的影子。为了让智能客服更好的为用户服务，使其生成的回复更加人性化，用户的情绪状态是重要的参考指标，因此通过用户输入的文本对其情感状态进行分析就显得尤为重要。
[0003]在智能客服领域，用户输入的文本都是句子级别的，很少有大篇幅的文本出现，因此其包含信息少，加之自然语言表达多样，同一个词在不同语境下表达的情感也可能不一样，等等难点都导致了想要精准的对短文本进行情感分类比较困难。
[0004]情感分类任务，在早期的时候，人们大多采用传统机器学习的方法，然而这些方法极其依赖特征工程，导致费时费力，不仅需要大量的领域知识，且鲁棒能力差，极易产生过拟合的现象。随着深度学习的发展，其不需要人为设计特征，可以自动学习提取特征，使其开始成为主流。研究员开始利用深度学习的各种网络结构来解决情感分类问题，并取得了一定的成果，但仍然存在一些问题。比如现在的网络结构利用如LSTM(Long Short
‑
Term Memory，长短期记忆网络)或transformer(多头注意力机制)等结构可以很好的进行上下文编码，但仍不能挖掘更深层次的内在联系，如句法结构这类联系。句法结构对理解句子的语义有重要作用。因为语言虽然看起...

【技术保护点】

【技术特征摘要】
1.一种文本情感识别方法，其特征在于，包括以下过程：获取样本数据；对所述样本数据进行标注，并根据情感类别对标注后的样本数据进行分类处理，以得到样本数据集；通过对所述样本数据集进行语法层次排序和上下文编码，建立第一网络模型；根据第一网络模型的输出结果和所述分类处理结果，建立第二网络模型，并对所述第二网络模型进行训练，以得到文本情感识别模型，所述文本情感识别模型包括依次连接的第一网络模型和训练后的第二网络模型；将待识别文本数据输入至所述文本情感识别模型，得到待识别文本数据的文本情感识别结果。2.根据权利要求1所述的文本情感识别方法，其特征在于，所述获取样本数据之后，还包括对所述样本数据进行预处理，所述预处理包括以下过程：将所述样本数据进行文本标准化处理，获得标准化样本数据，其中，所述文本标准化处理包括数字归一化、英文大小写统一化、字符编码标准化和/或中文繁简体统一化；对所述标准化样本数据进行文本清洗，去除非文本内容，获得清洗后样本数据；对所述清洗后样本数据进行文本纠错，获得预处理后样本数据。3.根据权利要求1所述的文本情感识别方法，其特征在于，所述第一网络模型为有序长短期记忆网络，所述第二网络模型为多头自注意力机制网络。4.根据权利要求3所述的文本情感识别方法，其特征在于，所述将待识别文本数据输入至所述文本情感识别模型，得到待识别文本数据的文本情感识别结果，包括：将待识别文本数据输入至所述文本情感识别模型，通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息，构建语句特征矩阵；将所述语句特征矩阵输入至所述第二网络模型，获得所述待识别文本数据属于预设的各情感类别的概率值，并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果。5.根据权利要求4所述的文本情感识别方法，其特征在于，所述将待识别文本数据输入至所述文本情感识别模型，通过所述第一网络模型提取所述待识别文本数据的句意特征和上下文编码信息，构建语句特征矩阵，包括：将所述待识别文本数据转化为特征矩阵；将所述特征矩阵输入至所述第二网络模型，提取所述特征矩阵中的层级信息，获得语句特征矩阵。6.根据权利要求4所述的文本情感识别方法，其特征在于，所述将所述语句特征矩阵输入至所述第二网络模型，获得所述待识别文本数据属于预设的各情感类别的概率值，并将概率值最高的情感类别作为所述待识别文本数据的情感识别结果，包括：根据预设的注意力机制运算，对输入至所述第二网络模型的所述语句特征矩阵进行处理，得到获得注意力矩阵；通过设置注意力矩阵的多跳连接，获取所述第二网络模型的最后一层注意力层输出的注意力矩阵；将所述最后一层注意力层输出的注意力矩阵中的各特...

【专利技术属性】
技术研发人员：杨稷，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人