文本情感分析方法、情感分析模型训练方法、装置、设备及介质制造方法及图纸

技术编号:31628331 阅读:12 留言:0更新日期:2021-12-29 19:06
本公开提供了一种文本情感分析方法、情感分析模型训练方法、装置、设备及介质,涉及自然语言处理领域,尤其涉及人工智能及大数据技术领域。具体实现方案为:获取评论语句,将评论语句输入情感分析模型,情感分析模型为通过训练数据集对textRNN模型训练得到的模型,训练数据集中包括多条样本评论语句以及NLPC模型对每个样本评论语句的情感分析结果。获取情感分析模型输出的情感分析结果。实现了在私有化环境中利用情感分析模型对评论语句进行情感分析。析。析。

【技术实现步骤摘要】
文本情感分析方法、情感分析模型训练方法、装置、设备及介质


[0001]本公开涉及自然语言处理
,尤其涉及人工智能及大数据


技术介绍

[0002]随着互联网科技的发展,越来越多的用户会在网上发表各种评论语句,通过对评论语句进行情感分析,可以准确了解用户需求,为用户提供更好的服务。

技术实现思路

[0003]本公开提供了一种文本情感分析方法、情感分析模型训练方法、装置、设备及介质。
[0004]根据本公开的第一方面,提供了一种文本情感分析方法,包括:
[0005]获取评论语句;
[0006]将所述评论语句输入情感分析模型,所述情感分析模型为通过训练数据集对textRNN模型训练得到的模型,所述训练数据集中包括多条样本评论语句以及定制自然语言处理NLPC模型对每个样本评论语句的情感分析结果;
[0007]获取所述情感分析模型输出的情感分析结果。
[0008]根据本公开的第二方面,提供了一种情感分析模型训练方法,包括:
[0009]构建训练数据集,所述训练数据集中包括多条样本评论语句以及基于NLPC模型对每条样本评论语句进行情感分析得到的标签情感分析结果;
[0010]基于所述训练数据集对textRNN模型进行训练,得到情感分析模型,所述情感分析模型用于对评论语句进行情感分析。
[0011]根据本公开的第三方面,提供了一种文本情感分析装置,包括:
[0012]获取模块,用于获取评论语句;
[0013]输入模块,用于将所述评论语句输入情感分析模型,所述情感分析模型为通过训练数据集对textRNN模型训练得到的模型,所述训练数据集中包括多条样本评论语句以及NLPC模型对每个样本评论语句的情感分析结果;
[0014]所述获取模块,还用于获取所述情感分析模型输出的情感分析结果。
[0015]根据本公开的第四方面,提供了一种情感分析模型训练装置,包括:
[0016]构建模块,用于构建训练数据集,所述训练数据集中包括多条样本评论语句以及基于NLPC模型对每条样本评论语句进行情感分析得到的标签情感分析结果;
[0017]训练模块,用于基于所述训练数据集对所述textRNN模型进行训练,得到情感分析模型,所述情感分析模型用于对评论语句进行情感分析。
[0018]根据本公开的第五方面,提供了一种电子设备,包括:
[0019]至少一个处理器;以及
[0020]与所述至少一个处理器通信连接的存储器;其中,
[0021]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面或第二方面所述的方法。
[0022]根据本公开的第六方面,提供了了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面或第二方面所述的方法。
[0023]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面或第二方面所述的方法。
[0024]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0025]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0026]图1是根据本公开实施例提供的一种文本情感分析方法的流程图;
[0027]图2是根据本公开实施例提供的另一种文本情感分析方法的流程图;
[0028]图3是根据本公开实施例提供的另一种文本情感分析方法的流程图;
[0029]图4是根据本公开实施例提供的另一种文本情感分析方法的流程图;
[0030]图5是根据本公开实施例提供的一种情感分析模型训练方法的流程图;
[0031]图6是根据本公开实施例提供的一种文本情感分析装置的结构示意图;
[0032]图7是根据本公开实施例提供的一种情感分析模型训练装置的结构示意图;
[0033]图8是用来实现本公开实施例的文本情感分析方法和情感分析模型训练方法的电子设备的框图。
具体实施方式
[0034]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0036]相关技术中,可以通过定制自然语言处理(Natural Language Processing Customization,NLPC)模型对评论语句进行情感分析,以确定评论语句的情感为正向、中性还是负向。目前,NLPC模型无法被部署在各网站的私有化环境中,且在各网站无法调用NLPC模型的接口进行情感分析,导致无法在网站本地完成对对评论语句的情感分析。
[0037]本公开实施例中的评论语句可以为用户在各种场景下的评论,例如,可以为某购物网站中用户关于所购买商品的评论,也可以为某视频网站中用户关于某个视频的评论,或者为旅行网站中用户对景点环境和票价的评论,本公开实施例对此不做具体限定。
[0038]本公开实施例提供的文本情感分析方法可以由电子设备执行,该电子设备可以为智能手机、平板电脑、台式电脑、服务器等设备。
[0039]以下对本公开实施例提供的文本情感分析方法进行详细介绍。
[0040]如图1所示,本公开实施例提供了一种文本情感分析方法,该方法包括:
[0041]S101、获取评论语句。
[0042]其中,电子设备可以获取指定时间段内产生的需要进行情感分析的评论语句。比如,旅行网站中一个月内用户对某一景点门票的评论,购物网站中一周内用户对某一商品的评论。
[0043]S102、将评论语句输入情感分析模型,情感分析模型为通过训练数据集对文本循环神经网络(text Recurrent Neural Network,textRNN)模型训练得到的模型,该训练数据集中包括多条样本评论语句以及NLPC模型对每个样本评论语句的情感分析结果。
[0044]其中,针对训练数据集中的每条样本评论语句,该样本评论语句的标注为NLPC模型对该评论语句的情感分析结果。
[0045]textRNN模型为利用RNN循环神经网络进行自然语言处理的模型,可以用于对给定文本进行文本分类,以确定文本的类型。在本公开实施例中,textRNN模型用于对评论语句进行情感分析,从而确定评论语句的情感分析结果。
[0046]其中,情感分析结果具体包括评论语句为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本情感分析方法,包括:获取评论语句;将所述评论语句输入情感分析模型,所述情感分析模型为通过训练数据集对textRNN模型训练得到的模型,所述训练数据集中包括多条样本评论语句以及定制自然语言处理NLPC模型对每个样本评论语句的情感分析结果;获取所述情感分析模型输出的情感分析结果。2.根据权利要求1所述的方法,在所述获取评论语句之后,所述方法还包括:对所述评论语句进行分词;将所述评论语句包括的词语与各高频词集合包括的高频词进行匹配,其中,每个高频词集合对应一个意图标签;将所述评论语句包括的词语所属高频词集合对应的意图标签作为所述评论语句的目标意图标签。3.根据权利要求2所述的方法,其中,所述情感分析结果包括所述评论语句为正向、负向和中性的概率;所述方法还包括:基于所述评论语句的情感分析结果和所述评论语句的目标意图标签确定所述评论语句针对所述目标意图标签的情感分析结果。4.根据权利要求2所述的方法,在对所述评论语句进行分词之前,所述方法还包括:获取指定时间段内产生的历史评论语句;对获取到的各历史评论语句进行分词;获取通过分词得到的词语中出现频次最高的第一预设数量个高频词;基于所述第一预设数量个高频词两两之间的相似度进行聚类,得到多个高频词集合;确定每个高频词集合对应的意图标签。5.根据权利要求4所述的方法,在所述确定每个高频词集合对应的意图标签之后,所述方法还包括:确定意图覆盖率,所述意图覆盖率为含有所述多个高频词集合中任一高频词的历史评论语句数量占获取到的历史评论语句总数量的比值;判断所述意图覆盖率是否达到预设阈值;若是,则确定完成高频词聚类;若否,则确定不含有高频词的历史评论语句中出现频次最高的第二预设数量个高频词;对从所述指定时间段内产生的历史评论语句中确定的所有高频词两两之间的相似度进行聚类,得到多个高频词集合;确定重新确定的每个高频词集合对应的意图标签,并返回所述确定意图覆盖率的步骤,直至所确定的意图覆盖率达到所述预设阈值时,确定完成高频词聚类。6.一种情感分析模型训练方法,包括:构建训练数据集,所述训练数据集中包括多条样本评论语句以及基于NLPC模型对每条样本评论语句进行情感分析得到的标签情感分析结果;基于所述训练数据集对textRNN模型进行训练,得到情感分析模型,所述情感分析模型用于对评论语句进行情感分析。
7.根据权利要求6所述的方法,所述基于所述训练集对所述textRNN模型进行训练,得到情感分析模型,包括:选择所述训练数据集中的一条样本评论语句,将该样本评论语句作为目标评论语句;通过所述textRNN模型处理所述目标评论语句,得到所述textRNN模型对所述目标评论语句的情感分类结果;基于所述textRNN模型对所述目标评论语句的情感分类结果以及所述目标评论语句的标签情感分析结果之间的差异,计算所述textRNN模型的损失值;基于所述损失值调整所述textRNN模型的参数,并返回选择所述训练数据集中的一条样本评论语句的步骤,直至所述textRNN模型收敛时,将训练得到的textRNN模型作为所述情感分析模型。8.根据权利要求7所述的方法,其中,通过所述textRNN模型处理所述目标评论语句,得到所述textRNN模型对所述目标评论语句的情感分类结果,包括:对所述目标评论语句进行分词操作,得到词特征序列;将所述词特征序列输入所述textRNN模型的嵌入层,得到所述目标评论语句的特征向量;通过所述textRNN模型中带注意力机制的循环神经网络层处理所述特征向量;将所述循环神经网络层输出的信息输入所述textRNN模型的全连接层,得到所述全连接层输出的情感分析结果。9.一种文本情感分析装置,包括:获取模块,用于获取评论语句;输入模块,用于将所述评论语句输入情感分析模型,所述情感分析模型为通过训练数据集对textRNN模型训练得到的模型,所述训练数据集中包括多条样本评论语句以及NLPC模型对每个样本评论语句的情感分析结果;所述获取模块,还用于获取所述情感分析模型输出的情感分析结果。10.根据权利要求9所述的装置,所述装置还包括:分词模块,用于对所述评论语句进行分词;匹配模块,用于将所述评论语句包括的词语与各高频词集...

【专利技术属性】
技术研发人员:计辉
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1