一种情感分析的装置和方法制造方法及图纸

技术编号:31632732 阅读:19 留言:0更新日期:2021-12-29 19:11
本发明专利技术公开一种情感分析的装置和方法,其中的一种情感分析的装置包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;实体抽取网络模块用以根据实体识别特征集抽取实体词;情感提取网络模块用以根据句子特征向量集得到情感词特征向量;特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征,此特征加强了实体和情感词的权重,能有效提升模型整体的实体识别和情感分类的准确率。在实际应用中,采用本发明专利技术所述的模型和方法能明显提高识别的准确率,具有较好的推广意义。具有较好的推广意义。具有较好的推广意义。

【技术实现步骤摘要】
一种情感分析的装置和方法


[0001]本专利技术涉及自然语言处理领域,尤其涉及一种情感分析的装置和方法。

技术介绍

[0002]随着网络技术的发展,越来越多的产品通过互联网进行销售,电商平台以及品牌方需要持续关注用户的评价,通过分析评价数据,抽取评价词的正负面,对产品和服务的反馈舆情进行挖掘,统计情感走势,以此为依据进一步对产品和服务进行改进。
[0003]目前现有的技术通常是采用两个模型,一个模型用于抽取产品名称,如药品、水杯,一个模型用于分析评价词的情感类型,在实际应用中,采用两个模型,存在重复建设、效率低下的缺陷,同时由于两个模型的输出数据相互独立,存在输出存在信息残缺不完整、缺乏关联性,数据利用率差的缺陷,例如一个句子中通过一个模型获得AB两个实体,通过另一个模型获得评价,但是不知道评价是对谁。

技术实现思路

[0004]本专利技术为解决现有技术中存在的上述缺陷,提出一种情感分析的装置和方法。
[0005]为了实现以上目的,本专利技术提出了一种情感分析的装置,包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:
[0006]特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;
[0007]特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;
[0008]实体抽取网络模块用以根据实体识别特征集抽取实体词;
[0009]情感提取网络模块用以根据句子特征向量集得到情感词特征向量;;
[0010]特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;
[0011]情感分类模块根据增强的情感特征输出情感类型。
[0012]进一步地,所述特征抽取模块采用Bert神经网络模型实现。
[0013]进一步地,所述特征优化模块采用双层LSTM神经网络模型实现。
[0014]进一步地,所述实体抽取网络模块包括分类器和抽取实体词模块,所述分类器用于得到实体词的位置,所述抽取实体词模块用于得到实体词的内容。
[0015]进一步的,所述实体抽取网络模块包括三个分类器,所述三个分类器分别用于抽取实体词的开始位置、中间位置和结束位置。
[0016]进一步的,所述情感提取网络模块包括动态特征加权模块、特征屏蔽模块和情感特征抽取模块,其中:
[0017]动态特征加权模块:用以根据离中心字特征向量的距离远近设置句子中每个字特征向量的权重,距离越远权重越小;
[0018]特征屏蔽模块:用以对距离中心字特征向量的值大于阈值的字进行屏蔽处理;
[0019]情感特征抽取模块:用以从处理过的句子特征向量集中抽取情感词特征向量。
[0020]进一步的,所述阈值是5个字长。
[0021]进一步的,所述情感特征抽取模块采用三层神经网络。
[0022]本专利技术还公开一种情感分析的方法,包括:
[0023]情感分析的装置读入有标签的句子;
[0024]对有标签的句子进行特征抽取,获取句子特征向量集;
[0025]将字特征向量进行优化处理,获得实体识别特征集;
[0026]从实体识别特征集中得到实体词的位置,进一步得到实体词;
[0027]从句子特征向量集中得到情感词特征向量;
[0028]将实体识别特征集和情感词特征向量进行拼接,得到增强的情感特征;
[0029]对增强的情感特征进行分类,得到情感类型;
[0030]所述的情感分析的装置为上述任一项所述的情感分析的装置。
[0031]本专利技术还公开一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行所述情感分析的方法。
[0032]本专利技术还公开一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行所述情感分析的方法。
[0033]本专利技术公开的方法和系统中所述模块,在实际应用中,即可以在一台目标服务器上部署多个模块,也可以每一模块独立部署在不同的目标服务器上,特别的,根据需要,为了提供更强大的计算处理能力,也可以根据需要将模块部署到集群目标服务器上。
[0034]由此可见,本专利技术的情感分析的装置通过一个模型同时实现了实体的识别和情感分析和分类的功能,节约了资源,提高了效率,并且,同一个模型输出的结果可以获得有关联性的输出,信息更加完整,数据利用率高。
[0035]为了对本专利技术有更清楚全面的了解,下面结合附图,对本专利技术的具体实施方式进行详细描述。
附图说明
[0036]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本申请实施例的一种情感分析的装置的结构示意图。
[0038]图2为本申请实施例的一种实体抽取网络模块的具体实施结构示意图。
[0039]图3为本申请实施例的一种情感提取网络模块的具体实施结构示意图。
[0040]其中:特征抽取模块1、特征优化模块2、实体抽取网络模块3、情感提取网络模块4、特征融合模块5、情感分类模块6。
具体实施方式
[0041]请参阅图1,图1示出了一种情感分析的装置的结构示意图。
[0042]本申请提出一种新型的情感分析的装置,读入有标签句子,获取句子中每个字的
特征向量,然后分别经过特征优化处理和特征融合处理,再通过实体抽取网络模块得到实体词,通过情感分类模块得到情感的分类。
[0043]作为一种实施方式,本申请实施例的情感分析的装置包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:
[0044]特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;
[0045]特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;
[0046]实体抽取网络模块用以根据实体识别特征集抽取实体词;
[0047]情感提取网络模块用以根据句子特征向量集得到情感词特征向量;
[0048]特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;
[0049]情感分类模块根据增强的情感特征输出情感类型。
[0050]作为一种举例,输入的句子:“A品牌的电脑质量很好,但是手机质量很差”,数据的处理过程如下:
[0051]1、先标注句子中的实体和情感面:(电脑质量,很好),(手机质量,很差),得到带标签的数据;
[0052]2、把此句子放入特征抽取模块抽取每个字的特征,得到句子特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感分析的装置,其特征是,包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;实体抽取网络模块用以根据实体识别特征集抽取实体词;情感提取网络模块用以根据句子特征向量集得到情感词特征向量;特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;情感分类模块根据增强的情感特征输出情感类型。2.如权利要求1所述的装置,其特征是,所述特征抽取模块采用Bert神经网络模型实现。3.如权利要求1所述的装置,其特征是,所述特征优化模块采用双层LSTM神经网络模型实现。4.如权利要求1所述的装置,其特征是,所述实体抽取网络模块包括分类器和抽取实体词模块,所述分类器用于得到实体词的位置,所述抽取实体词模块用于得到实体词的内容。5.如权利要求4所述的装置,其特征是,所述实体抽取网络模块包括三个分类器,所述三个分类器分别用于抽取实体词的开始位置、中间位置和结束位置。6.如权利要求1所述的装置,其特征是,所述情感提取网络模块包括动态特征加权模块、特征屏蔽模块和情感特征抽取模块,其中:动态特征加权模块:用以根据离中心字特征向量的距离远近设置句子中...

【专利技术属性】
技术研发人员:曾祥云朱姬渊
申请(专利权)人:上海大参林医疗健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1