【技术实现步骤摘要】
一种文本情感分析模型的优化方法及装置
本申请涉及文本分析
,具体而言,涉及一种文本情感分析模型的优化方法及装置。
技术介绍
随着社交软件和电商平台等应用的蓬勃发展,存在于这些应用中的海量文本数据蕴含着大众对某些热点事件的情感态度,传统的文本情感分析方法鲁棒性较低,在文本被恶意添加扰动或被破坏时,将对情感分析系统造成一定的干扰,导致结果误判。
技术实现思路
本申请实施例的目的在于提供一种文本情感分析模型的优化方法及装置,结合基于情感词的全局注意力机制、基于自适应尺度的局部注意力机制和对抗Dropout并对模型进行优化,提高模型的鲁棒性和情感分类结果的准确性,解决现有方法鲁棒性较低、结果不准确的问题。本申请实施例提供了一种文本情感分析模型的优化方法,所述方法包括:获取输入文本对应的第一词向量;将所述第一词向量分别输入预设的对抗Dropout的情感词注意力模型和对抗Dropout的自适应尺度注意力模型,以分别获得情感词注意力特征和自适应尺度注意力特征;对所述第一词向量添加对抗扰动以生成第二词向量;将所述第二词向量分别输入对抗Dropout的情感词注意力模型和随机Dropout的情感词注意力模型,以对所述对抗Dropout的情感词注意力模型进行基于情感词的注意力计算,并获得对抗情感词注意力特征;将所述第二词向量分别输入对抗Dropout的自适应尺度注意力模型和随机Dropout的自适应尺度注意力模型,以对所述对抗Dropout的自适应尺度注意力模型进行 ...
【技术保护点】
1.一种文本情感分析模型的优化方法,其特征在于,所述方法包括:/n获取输入文本对应的第一词向量;/n将所述第一词向量分别输入预设的对抗Dropout的情感词注意力模型和对抗Dropout的自适应尺度注意力模型,以分别获得情感词注意力特征和自适应尺度注意力特征;/n对所述第一词向量添加对抗扰动以生成第二词向量;/n将所述第二词向量分别输入对抗Dropout的情感词注意力模型和随机Dropout的情感词注意力模型,以对所述对抗Dropout的情感词注意力模型进行基于情感词的注意力计算,并获得对抗情感词注意力特征;/n将所述第二词向量分别输入对抗Dropout的自适应尺度注意力模型和随机Dropout的自适应尺度注意力模型,以对所述对抗Dropout的自适应尺度注意力模型进行基于自适应尺度的注意力计算,并获得对抗自适应尺度注意力特征;/n将所述情感词注意力特征和所述自适应尺度注意力特征进行拼接生成融合特征;/n基于所述融合特征、所述对抗情感词注意力特征和所述对抗自适应尺度注意力特征并利用分类器获取总损失;/n最小化所述总损失,以优化文本情感分析模型。/n
【技术特征摘要】
1.一种文本情感分析模型的优化方法,其特征在于,所述方法包括:
获取输入文本对应的第一词向量;
将所述第一词向量分别输入预设的对抗Dropout的情感词注意力模型和对抗Dropout的自适应尺度注意力模型,以分别获得情感词注意力特征和自适应尺度注意力特征;
对所述第一词向量添加对抗扰动以生成第二词向量;
将所述第二词向量分别输入对抗Dropout的情感词注意力模型和随机Dropout的情感词注意力模型,以对所述对抗Dropout的情感词注意力模型进行基于情感词的注意力计算,并获得对抗情感词注意力特征;
将所述第二词向量分别输入对抗Dropout的自适应尺度注意力模型和随机Dropout的自适应尺度注意力模型,以对所述对抗Dropout的自适应尺度注意力模型进行基于自适应尺度的注意力计算,并获得对抗自适应尺度注意力特征;
将所述情感词注意力特征和所述自适应尺度注意力特征进行拼接生成融合特征;
基于所述融合特征、所述对抗情感词注意力特征和所述对抗自适应尺度注意力特征并利用分类器获取总损失;
最小化所述总损失,以优化文本情感分析模型。
2.根据权利要求1所述的文本情感分析模型的优化方法,其特征在于,所述方法还包括:
构建LSTM模型,以生成情感词注意力模型;
构建卷积神经网络模型,以生成自适应尺度注意力模型。
3.根据权利要求2所述的文本情感分析模型的优化方法,其特征在于,所述将所述第一词向量输入对抗Dropout的情感词注意力模型,以获得情感词注意力特征,包括:
通过所述LSTM模型和所述第一词向量获取每个时刻的隐藏层输出状态的注意力权重;
所述注意力权重为:
且
其中,score(hi)=Vαtanh(hiWα+bα)表示第i个时刻隐藏输出状态hi的注意力得分,m表示所述输入文本的长度,Wα表示注意力权重矩阵,bα表示对应的偏置项;
基于所述每个时刻的隐藏层输出状态以及对应的注意力权重获取所述情感词注意力特征;
所述情感词注意力特征为:
4.根据权利要求3所述的文本情感分析模型的优化方法,其特征在于,所述将所述第一词向量输入对抗Dropout的自适应尺度注意力模型,以获得自适应尺度注意力特征,包括:
将所述第一词向量输入卷积核大小不同的卷积层以得到不同尺度对应的尺度特征;
将每个所述尺度特征进行标量表示并进行拼接生成标量集合;
所述标量集合为:
S={l∈L|sl};
其中,l表示第l种卷积核,L表示卷积核的种类,sl表示所述尺度特征进行标量值,K表示尺度特征的维度,xl表示第l种卷积核进行卷积操作后得到的尺度特征;
根据所述标量集合计算所述尺度特征的注意力权重集合;
所述注意力权重集合为:
α=softmax(MLP(S));
其中,MLP表示多层感知机;
根据所述尺度特征和对应的注意力权重获取所述自适应尺度注意力特征;
所述自适应尺度注意力特征表示为:
且
其中,αl表示第l个尺度特征的注意力权重,表示第l个尺度特征的自适应尺度注意力特征,表示自适应尺度注意力特征的集合。
5.根据权利要求1所述的文本情感分析模型的优化方法,其特征在于,所述基于所述融合特征、所述对抗情感词注意力特征和所述对抗自适应尺度注意力特征并利用分类器获取总损失,包括:
基于所述融合特征利用Softmax分类器进行计算,得到分类损失,所述分类损失可更新所述对抗扰动;
所述分类损失为:
其中,yi为真实类别,为预测类别,N为样本总数量;
将所述对抗情感词注意力特征和所述对抗自适应尺度注意力特征分别利用分类器进行计算,分别得到情感词对抗损失和自适应尺度对抗损失;
所述情感词对抗损失为:
其中,r′αp表示所述对抗扰动,ε′AdD表示LSTM模型的对抗Dropout遮蔽,N为样本总数量,sn表示所述输入文本的词向量集合,yn表示所述输入文本对应的标签,θ表示LST...
【专利技术属性】
技术研发人员:任亮,傅雨梅,罗刚,
申请(专利权)人:北京知因智慧科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。