【技术实现步骤摘要】
基于多通道神经网络的文本情感分析方法
本专利技术属于计算机
,涉及基于多通道神经网络的文本情感分析方法。
技术介绍
近年来,随着微博、微信、美团、Twitter等平台的兴起以及移动互联网技术的飞速发展,越来越多人习惯在网络上发表他们的观点或评论。例如:网民在微博或Twitter上发表观点或心情;消费者在美团等网站发表对餐馆或酒店的评价;购物者通过电商网站评论商品等。但是面对网络产生的海量数据,使用人工识别是十分困难且不现实的,因此如何合理的使用计算机技术处理分析数据,成为高效使用这些数据的一大难题。由于自然语言的多义性,以及情感的长期依赖性,文本情感分析是一个巨大的挑战。大多数文本中会同时包含正向和负向表述,这使得正确地判别出文本整体情感极性变得极其复杂。文本情感分析通过学习文本上下文信息判定文本情感极性,近年来得到广泛关注。文本情感分析的难点是对上下文内容关系建模以及整体情感判别。国内外研究者提出许多有效的研究方法,大多采用传统自然语言特征或机器学习的方式进行文本情感分析。传统自然语言处理任务依靠极性标签或句 ...
【技术保护点】
1.基于多通道神经网络的文本情感分析方法,其特征在于:该方法包括以下步骤:/n步骤一:通过文本数据使用词嵌入技术训练词向量,并将文本映射为词向量矩阵;/n步骤二:使用空洞CNN和双向LSTM通过词向量矩阵提取文本的高层上下文特征,利用双向LSTM提取文本的原始上下文特征;/n步骤三:利用多通道模型,融合不同视距的上下文特征和原始上下文特征,通过局部注意力机制对各通道的特征进行加权,生成全局特征;/n步骤四:利用全局注意力模块突出全局特征中的重要信息,最后使用Top-K池化策略对特征进行筛选;/n步骤五:使用自适应加权损失函数,使模型自动关注难以分类和训练样本少的类别,以提高模型的分类性能。/n
【技术特征摘要】
1.基于多通道神经网络的文本情感分析方法,其特征在于:该方法包括以下步骤:
步骤一:通过文本数据使用词嵌入技术训练词向量,并将文本映射为词向量矩阵;
步骤二:使用空洞CNN和双向LSTM通过词向量矩阵提取文本的高层上下文特征,利用双向LSTM提取文本的原始上下文特征;
步骤三:利用多通道模型,融合不同视距的上下文特征和原始上下文特征,通过局部注意力机制对各通道的特征进行加权,生成全局特征;
步骤四:利用全局注意力模块突出全局特征中的重要信息,最后使用Top-K池化策略对特征进行筛选;
步骤五:使用自适应加权损失函数,使模型自动关注难以分类和训练样本少的类别,以提高模型的分类性能。
2.根据权利要求1所述的基于多通道神经网络的文本情感分析方法,其特征在于:所述步骤一中,词向量矩阵表示过程为:首先将原始文本数据进行分词,然后将分词处理后的文本输入Skip-gram模型训练词向量其中d代表词向量维度,从而得到词嵌入矩阵;定义文本s,其中s分词后表示为{w1,...,wt-1,wt,wt+1,...,wm},wt为文本的第t个词,m为文本所包含的单词个数,从而词嵌入层通过词嵌入矩阵将文本{w1,...,wt-1,wt,wt+1,...,wm}映射为其中,若未在词嵌入矩阵中的词,则使用d维的随机向量表示该词;为使输入保存一致,将模型输入序列长度设置为k,对于长度小于k的文本,使用d维的零向量将其词向量矩阵扩展到k×d,而对于长度大于k的文本,通过剪切将其长度限制到k;文本词向量矩阵表示为:
其中,表示连接符号。
3.根据权利要求1所述的基于多通道神经网络的文本情感分析方法,其特征在于:所...
【专利技术属性】
技术研发人员:甘臣权,冯庆东,张祖凡,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。