文本的情感分析方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:23605262 阅读:24 留言:0更新日期:2020-03-28 06:12
本申请实施例提供了一种文本的情感分析方法、装置、电子设备及可读存储介质。该方法包括:基于Bi‑directional Long Short‑Term Memory模型,确定待处理文本的第一情感强度值;基于预定的情感表达规则,确定待处理文本的第二情感强度值;获取待处理文本的主题词,基于主题词以及预设的主题词权重,确定待处理文本的第三情感强度值;基于第一情感强度值、第二情感强度值以及第三情感强度值,确定待处理文本的情感分析结果。本申请提供的方案,通过对待处理文本的分析,快速获取待处理文本的情感分析结果,能够及时获取网民发布信息的情感极性。

Emotional analysis methods, devices, electronic devices and readable storage media of texts

【技术实现步骤摘要】
文本的情感分析方法、装置、电子设备及可读存储介质
本申请涉及自然语言处理
,具体而言,本申请涉及一种文本的情感分析方法、装置、电子设备及可读存储介质。
技术介绍
随着互联网的普及和移动互联的崛起、媒体以及自媒体时代的到来,网民参与的信息传播越来越多和复杂。在重大事件发生的舆论传播中,网民可能会发布大量信息,通过人工无法及时的掌握网民发布信息的情感极性,因此,如何对网民发布的大量信息进行分析并及时获取网民的情感极性,成为了自然语言处理
的一个亟待解决的问题。
技术实现思路
本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的技术方案如下:第一方面,本申请实施例提供了一种文本的情感分析方法,该方法包括:基于双向长短记忆网络Bi-directionalLongShort-TermMemory模型,确定待处理文本的第一情感强度值;基于预定的情感表达规则,确定待处理文本的第二情感强度值;获取待处理文本的主题词,基于主题词以及预设的主题词权重,确定待处理文本的第三情感强度值;基于第一情感强度值、第二情感强度值以及第三情感强度值,确定待处理文本的情感分析结果。可选地,基于预定的情感表达规则,确定待处理文本的第二情感强度值,包括:根据待处理文本中的标点符号,将待处理文本中的整句划分为子句;确定子句的第四情感强度值;基于第四情感强度值确定第二情感强度值。可选地,确定子句的第四情感强度值,包括:确定子句中情感词、修饰情感词的否定词以及修饰情感词的程度副词;确定子句的句型;基于情感词对应的预设权重、否定词对应的预设权重系数以及程度副词对应的预设权重系数,并基于句型对应的预设权重系数,确定第四情感强度值。可选地,基于第四情感强度值确定第二情感强度值,包括:基于待处理文本中的各子句中的关联词,确定各子句与相邻子句的句间关系;基于第四情感强度值以及句间关系对应的预设权重系数确定第二情感强度值。可选地,基于第一情感强度值、第二情感强度值以及第三情感强度值,确定待处理文本的情感分析结果,包括:基于第一情感强度值、第一情感强度值对应的预设权重系数、第二情感强度值、第二情感强度值对应的预设权重系数、第三情感强度值、第三情感强度值对应的预设权重系数以及预设的情感强度的修正系数,确定待处理文本的第五情感强度值;基于第五情感强度值确定待处理文本的情感分析结果。可选地,待处理文本的情感分析结果包括待处理文本的情感极性,基于第五情感强度值确定待处理文本的情感分析结果,包括:基于第五情感强度值以及预设的情感强度阈值,确定待处理文本的情感极性。第二方面,本申请实施例提供了一种文本的情感分析装置,该装置包括:第一情感强度确定模块,用于基于Bi-directionalLongShort-TermMemory模型,确定待处理文本的第一情感强度值;第二情感强度确定模块,用于基于预定的情感表达规则,确定待处理文本的第二情感强度值;第三情感强度确定模块,用于获取待处理文本的主题词,基于主题词以及预设的主题词权重,确定待处理文本的第三情感强度值;情感分析结果确定模块,用于基于第一情感强度值、第二情感强度值以及第三情感强度值,确定待处理文本的情感分析结果。可选地,第二情感强度确定模块用于:根据待处理文本中的标点符号,将待处理文本中的整句划分为子句;确定子句的第四情感强度值;基于第四情感强度值确定第二情感强度值。可选地,第二情感强度确定模块在确定子句的第四情感强度值时,具体用于:确定子句中情感词、修饰情感词的否定词以及修饰情感词的程度副词;确定子句的句型;基于情感词对应的预设权重、否定词对应的预设权重系数以及程度副词对应的预设权重系数,并基于句型对应的预设权重系数,确定第四情感强度值。可选地,第二情感强度确定模块在基于第四情感强度值确定第二情感强度值时,具体用于:基于待处理文本中的各子句中的关联词,确定各子句与相邻子句的句间关系;基于第四情感强度值以及句间关系对应的预设权重系数确定第二情感强度值。可选地,第三情感强度确定模块具体用于:基于第一情感强度值、第一情感强度值对应的预设权重系数、第二情感强度值、第二情感强度值对应的预设权重系数、第三情感强度值、第三情感强度值对应的预设权重系数以及预设的情感强度的修正系数,确定待处理文本的第五情感强度值;基于第五情感强度值确定待处理文本的情感分析结果。可选地,待处理文本的情感分析结果包括待处理文本的情感极性,第三情感强度确定模块在基于第五情感强度值确定待处理文本的情感分析结果时,具体用于:基于第五情感强度值以及预设的情感强度阈值,确定待处理文本的情感极性。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器和存储器;存储器,用于存储操作指令;处理器,用于通过调用操作指令,执行如本申请的第一方面的任一实施方式所示的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请的第一方面的任一实施方式所示的方法。本申请实施例提供的技术方案带来的有益效果是:本申请实施例提供的方案,基于Bi-directionalLongShort-TermMemory模型确定待处理文本的第一情感强度值,基于情感表达规则确定待处理文本的第二情感强度值,并基于待处理文本的主题词以及主题词权重,确定待处理文本的第三情感强度值,从而基于第一情感强度值、第二情感强度值以及第三情感强度值确定待处理文本的情感分析结果,本方案通过对待处理文本的分析,快速获取待处理文本的情感分析结果,能够及时获取网民发布信息的情感极性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。图1为本申请实施例提供的一种文本的情感分析方法的流程示意图;图2为本申请实施例的一种具体实施方式的流程示意图;图3为本申请实施例中word2vector模型的训练流程示意图;图4为本申请实施例中BiLSTM模型的训练流程示意图;图5为本申请实施例中对BiLSTM模型进行参数调整以及模型测试的流程示意图;图6为本申请实施例提供的一种待处理文本的情感分析系统的结构示意图;图7为本申请实施例提供的一种文本的情感分析装置的结构示意图;图8为本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本专利技术的限制。本文档来自技高网...

【技术保护点】
1.一种文本的情感分析方法,其特征在于,包括:/n基于双向长短记忆网络Bi-directional Long Short-Term Memory模型,确定待处理文本的第一情感强度值;/n基于预定的情感表达规则,确定所述待处理文本的第二情感强度值;/n获取所述待处理文本的主题词,基于所述主题词以及预设的主题词权重,确定所述待处理文本的第三情感强度值;/n基于所述第一情感强度值、所述第二情感强度值以及所述第三情感强度值,确定所述待处理文本的情感分析结果。/n

【技术特征摘要】
1.一种文本的情感分析方法,其特征在于,包括:
基于双向长短记忆网络Bi-directionalLongShort-TermMemory模型,确定待处理文本的第一情感强度值;
基于预定的情感表达规则,确定所述待处理文本的第二情感强度值;
获取所述待处理文本的主题词,基于所述主题词以及预设的主题词权重,确定所述待处理文本的第三情感强度值;
基于所述第一情感强度值、所述第二情感强度值以及所述第三情感强度值,确定所述待处理文本的情感分析结果。


2.根据权利要求1所述的方法,其特征在于,所述基于预定的情感表达规则,确定所述待处理文本的第二情感强度值,包括:
根据所述待处理文本中的标点符号,将所述待处理文本中的整句划分为子句;
确定所述子句的第四情感强度值;
基于所述第四情感强度值确定所述第二情感强度值。


3.根据权利要求2所述的方法,其特征在于,所述确定所述子句的第四情感强度值,包括:
确定所述子句中情感词、修饰所述情感词的否定词以及修饰所述情感词的程度副词;
确定所述子句的句型;
基于所述情感词对应的预设权重、所述否定词对应的预设权重系数以及所述程度副词对应的预设权重系数,并基于所述句型对应的预设权重系数,确定所述第四情感强度值。


4.根据权利要求2所述的方法,其特征在于,所述基于所述第四情感强度值确定所述第二情感强度值,包括:
基于所述待处理文本中的各子句中的关联词,确定各子句与相邻子句的句间关系;
基于所述第四情感强度值以及所述句间关系对应的预设权重系数确定所述第二情感强度值。


5.根据权利要求1所述的方法,其特征在于,所述基于所述第一情感强度值、所述第二情感强度值以及所述第三情感强度值,确定所述待处理文本的情感分析结果,包括:
基于所述第一情感强度值、所述第一情感强度值对应的预设权重系数、第二情感强度值...

【专利技术属性】
技术研发人员:韩勇赵立永吴新丽李丹刘启明代继涛
申请(专利权)人:新华网股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1