一种情感分析方法技术

技术编号:30901266 阅读:15 留言:0更新日期:2021-11-22 23:45
本发明专利技术公开了一种情感分析方法,传统的文本分析方法对文本显著特征提取能力较弱、学习速率相对缓慢,不能很好满足网络用户的需求。为解决这一问题,我们提出了一个基于注意力机制的混合网络模型,利用了传统的卷积神经网络对样本向量的局部信息进行特征提取;将其输入耦合输入和遗忘门网络模型,用以学习前后词句之间的联系;再加入注意力机制层,对深层次文本信息进行权重分配,提高重要信息对文本情感分类的影响强度。分类的影响强度。分类的影响强度。

【技术实现步骤摘要】
一种情感分析方法


[0001]情感分析领域。

技术介绍

[0002]情感识别和情感分析已成为社交媒体的新趋势,随着通信技术的进步,智能手机的丰富和社交媒体的迅速崛起,网络用户通常以文本及视频的形式上传大量数据。为此,人们已经提出了一些不同的情感分析方法,包括基于传统的单峰的支持向量机的分类方法,以及基于深度学习的分类方法包括循环神经网络和卷积神经网络。为了更加准确地进行网络视频的情感分析,我们提出了一个基于注意力机制的卷积耦合输入和遗忘门网络的混合模型来分析文本的情感。

技术实现思路

[0003]本专利提出一种情感分析方法,其特征在于,所提供情感分析方法包括以下步骤:
[0004]步骤1:对文本数据集进行预处理,并将中文文本转换为128维的词向量来作为提取特征的输入数据,对训练集和测试集按照8:2进行均匀划分。具体操作为:
[0005]步骤11、对文本内容进行预处理工作,包括对文本数据进行分词处理和去除停用词,提供分类的关键信息;
[0006]步骤12、统一数据样本为128维的索引向量的形式;
[0007]步骤13、对训练集和测试集按照8:2进行均匀划分。
[0008]步骤2:拼接词向量成为词向量矩阵,依次输入卷积神经网络和耦合输入和遗忘门网络模型。具体操作为:
[0009]步骤21、提取文本特征,将文本表示为词向量矩阵x
1:l
∈R
l
×
d
,其中l表示句子的长度,d为该词向量的维度;
[0010]步骤22、使用卷积神经网络层对文本特征进行提取,卷积过程表示为:C
t
=f(w
·
x
t+k
‑1+b),其中b为该滤波器对应的偏置,ω为参与计算的权重计算矩阵,f采用了ReLu作为非线性激活函数,滤波器窗口大小为k*k,x
t+k
‑1为第t+k

1个词向量;
[0011]步骤23、将卷积神经网络层提取的特征向量输入耦合输入和遗忘门网络模型,学习前后词句之间的联系,耦合输入和遗忘门网络细胞更新过程可通过下列公式表示:其中C
t
是该细胞的输出,C
t
‑1为前一个细胞的输出结果,f
t
和为t时刻耦合输入和遗忘门网络更新计算过程中的两个中间变量。
[0012]步骤3、加入注意力机制层为各文本向量分配合适的权重,并输入softmax文本分类层,计算文本情感预测值。具体操作为:
[0013]步骤31、将耦合输入和遗忘门网络层输出矩阵输入注意力机制层,注意力层提取后的文本特征向量s是基于t时刻旧的隐层状态占新的隐层状态比重a
t
与旧的隐层状态h
t
依次相乘然后累加求得,相关公式如下:
[0014][0015][0016]e
t
=z
t tanh(w
t h
t
+b
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0017]其中,e
t
表示t时刻h
t
所决定的能量数值,z
t
和ωt分别表示第t时刻参与计算的权重系数矩阵,b
t
表示第t时刻对应的偏移量。将s作为预测层的输入,使用softmax函数可计算测试文本不同属性类别的概率大小。
[0018]步骤32、将步骤31得到的特征作为分类层的输入x,使用softmax函数来计算每个文本分属不同类别的概率大小p,可以描述为以下公式:
[0019][0020]其中,文本分为k=2个类别,w
k
和b
k
是该层的权重和偏置;
[0021]步骤33、进行文本类别判断,当概率值p>=0.5,判定文本数据情感为积极类别,当概率值p<0.5,判定文本数据情感为消极类别,并与文本标签进行对比,得到模型分类的正确率。
[0022]与现有技术相比,本专利技术具有如下有益效果:
[0023]1.本专利技术所提出的算法模型相较于传统机器学习算法分类准确率有了明显的提高;
[0024]2.本专利技术所提出的算法模型相较于传统机器学习算法有效提高了算法的F

SCORE值。
附图说明
[0025]图1为耦合输入和遗忘门网络单元结构图;
[0026]图2为模型结构流程图;
[0027]图3为文本预处理流程示意图;
[0028]图4为提取文本特征流程示意图;
[0029]图5为情感权重分配及文本情感值计算流程示意图。
具体实施方式
[0030]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本专利技术所附权利要求书所限定的范围。
[0031]本专利提出一种结合注意力机制的混合网络模型的情感分析的设计方法包括以下步骤:
[0032]步骤1:对文本数据集进行预处理,并将中文文本转换为128维的词向量来作为提
取特征的输入数据,对训练集和测试集按照8:2进行均匀划分。具体操作为:
[0033]步骤11、对文本内容进行预处理工作,包括对文本数据进行分词处理和去除停用词,提供分类的关键信息;
[0034]步骤12、统一数据样本词向量为128维的索引向量的形式;
[0035]步骤13、将文本数据集按照8:2分为文本数据训练集和文本数据测试集。
[0036]步骤2:拼接词向量成为词向量矩阵,依次输入卷积神经网络和耦合输入和遗忘门网络模型。具体操作为:
[0037]步骤21、提取文本特征,将文本表示为词向量矩阵x
1:l
∈R
l
×
d
,其中l表示句子的长度,d为该词向量的维度;
[0038]步骤22、使用卷积神经网络层对文本特征进行提取,卷积过程表示为:C
t
=f(w
·
x
t+k
‑1+b),其中b为该滤波器对应的偏置,ω为参与计算的权重计算矩阵,f采用了ReLu作为非线性激活函数,滤波器窗口大小为k*k,x
t+k
‑1为第t+k

1个词向量;
[0039]步骤23、将卷积神经网络层提取的特征向量输入耦合输入和遗忘门网络模型,学习前后词句之间的联系,耦合输入和遗忘门网络细胞更新过程可通过下列公式表示:其中C
t
是该细胞的输出,C
t
‑1为前一个细胞的输出结果,f
t
和为t时刻耦合输入和遗忘门网络更新计算过程中的两个中间变量。
[0040]步骤3、加入注意力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感分析方法,其特征在于,所提供情感分析方法包括以下步骤:步骤1、对文本数据集进行预处理,并将中文文本转换为维度一定的词向量来作为提取特征的输入数据,对训练集和测试集按照8:2进行均匀划分;步骤2、拼接词向量成为词向量矩阵,依次输入卷积神经网络和耦合输入和遗忘门网络模型;步骤3、加入注意力机制层为各文本向量分配合适的权重,并输入softmax文本分类层,计算文本情感预测值。2.根据权利要求1所述的一种结合注意力机制的混合网络模型的情感分析方法,其特征在于,步骤1中,对文本数据集进行预处理,并将中文文本转换为维度一定的词向量来作为提取特征的输入数据,对训练集和测试集进行均匀划分,包括如下步骤:步骤11、对文本内容进行预处理工作,包括对文本数据进行分词处理和去除停用词,提供分类的关键信息;步骤12、统一数据样本词向量为128维的索引向量的形式;步骤13、将文本数据集按照8:2分为文本数据训练集和文本数据测试集。3.根据权利要求1所述的一种情感分析方法,其特征在于,步骤2中,拼接词向量成为词向量矩阵,依次输入卷积神经网络和耦合输入和遗忘门网络模型模型,包括如下步骤:步骤21、提取文本特征,将文本表示为词向量矩阵x
1:l
∈R
l
×
d
,其中l表示句子的长度,d为该词向量的维度;步骤22、使用卷积神经网络层对文本特征进行提取,卷积过程表示为:C
t
=f(w
·
x
t+k
‑1+b),其中b为该滤波器对应的偏置,ω为参与计算的权重计算矩阵,f采用了ReLu作为非线性激活函数,滤波器窗口大小为k*k,x
t+k
‑1为第t+k

1个词向量;步骤23、将卷积神经网络层提取的特征向量输入耦合输入和遗忘门网络模型,学习前后词句之间的联系,耦合输入和遗忘门网络细胞更新过程可通过下列公式表示:...

【专利技术属性】
技术研发人员:邹波蓉王康佳王伟东张恺石峰李辉
申请(专利权)人:河南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1