情感分析模型的训练方法及系统技术方案

技术编号：28623295 阅读：13 留言：0更新日期：2021-05-28 16:19

本发明专利技术实施例提供一种情感分析模型的训练方法。该方法包括：利用第一数量从互联网爬取的与情感信号相关的弱监督训练集，对情感分析模型的卷积神经网络进行预训练；基于第二数量的监督训练集，对预训练后的情感分析模型中的分类层进行训练，得到训练后的情感分析模型。本发明专利技术实施例还提供一种情感分析模型的训练系统。本发明专利技术实施例在预训练过程中有效利用了弱监督信息使CNN模型的参数得到充分训练，又在对预训练模型进行微调训练的过程中进一步学习监督数据的样本特征，同时对弱监督数据中的噪声影响进行一定程度的更正，提高了情感分析模型性能。

全部详细技术资料下载

【技术实现步骤摘要】
情感分析模型的训练方法及系统
本专利技术涉及智能语音领域，尤其涉及一种情感分析模型的训练方法及系统。
技术介绍
通过分析语句的情感，可以获取出人们在说出这句话时的喜怒哀乐，从而进行针对性的回复。对于情感分析，通常会根据已有的情感词典、情感语料以及主观文本中带有情感倾向的句子结构单元对目标文本进行情感打分，来判断文本的情感倾向性。还有一些相对复杂的方法，例如：基于传统机器学习的情感分析方法：主要针对已标注的语料进行特征抽取(比如n-gram、词性标注等)，采用监督学习的方式训练机器学习算法(比如朴素贝叶斯、最大熵、支持向量机等)，使之能够自动判别目标文本的情感倾向性；基于深度学习的情感分析方法：深度学习模型具有多层非线性的网络结构，通过在不同隐藏层之间传递特征的抽象表示，使得“高层”的隐藏层能够获取更加抽象的特征表达。通过深度神经网络模型对文本的语义特征进行抽取与合成计算，从而实现模型对文本的深层次的语义理解；基于神经网络的词向量表达技术：该技术的主要做法是讲词语映射到一个多维度的稠密向量，通过神经网络对中心词与其对应的上下文建立语言模型，然后将该语言模型作为其他自然语言处理任务模型的特征输入层。在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：基于规则的情感分析方法：过于依赖情感词典、情感语料，开源的情感语料有限，不同领域的情感语料差别较大，并且整理情感语料十分消耗人力，导致这种方法的泛化性极差；只停留在语句和句子结构单元层面的情感特征抽取，容易丢失文本中的一些...

【技术保护点】
1.一种情感分析模型的训练方法，包括：/n利用第一数量从互联网爬取的与情感信号相关的弱监督训练集，对所述情感分析模型的卷积神经网络进行预训练；/n基于第二数量的监督训练集，对预训练后的情感分析模型中的分类层进行训练，得到训练后的情感分析模型。/n

【技术特征摘要】
1.一种情感分析模型的训练方法，包括：
利用第一数量从互联网爬取的与情感信号相关的弱监督训练集，对所述情感分析模型的卷积神经网络进行预训练；
基于第二数量的监督训练集，对预训练后的情感分析模型中的分类层进行训练，得到训练后的情感分析模型。

2.根据权利要求1所述的方法，其中，所述弱监督训练集包括：在社交网络中爬取的与情感信号相关的数据。

3.根据权利要求2所述的方法，其中，所述与情感信号相关的数据包括：附带有表情符号的语料，其中，所述表情符号至少包括：积极表情符号、消极表情符号。

4.根据权利要求1所述的方法，其中，所述第二数量小于所述第一数量。

5.根据权利要求1所述的方法，其中，在所述利用第一数量从互联网爬取的与情感信号相关的弱监督训练集之前，所述方法还包括：
提取无标注语料的词向量，构建情感分析模型的卷积神经网络；
在所述得到训练后的情感分析模型之后，所述方法还包括：
利用监督测试集对所述训练后的情感分析模型进行情感分类预测，得到所述训练后的情感分析模型的分类结果。

6.根据权利要求1所述的方法，其中，对所述情感分析模型的卷积神经网络进行预训练包括：
训练所述卷积神经网络中的分类层的参...

【专利技术属性】
技术研发人员：张越，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人