文本情感分析的方法、装置、设备和存储介质制造方法及图纸

技术编号:38985922 阅读:8 留言:0更新日期:2023-10-07 10:16
本申请提供一种文本情感分析的方法、装置、设备和存储介质,可以应用于人工智能领域或金融领域,方法包括:获得待处理文本,并分割待处理文本,得到多个待处理词汇。针对每一个待处理词汇,根据待处理词汇的词性特征和预训练的第一词向量模型,确定待处理词汇的第一词向量;利用预训练的情感分析网络处理由各个待处理词汇的第一词向量构成的文本矩阵,获得表征待处理文本的情感倾向的情感标签。本方案能够根据词汇在具体语境的词性确定特定的词向量,从而提高后续分析得到的情感标签的准确度。度。度。

【技术实现步骤摘要】
文本情感分析的方法、装置、设备和存储介质


[0001]本专利技术涉及情感分析
,特别涉及一种文本情感分析的方法、装置、设备和存储介质。

技术介绍

[0002]文本的情感分析,是文本处理技术的一种重要应用场景。目前的文本情感分析方法,一般将文本中的词汇转换为特定的词向量,而没有考虑同一词汇在不同语境中词性的区别(例如某些语境下为贬义,另一些语境下为褒义),导致最终根据词向量处理得到的文本的情感标签不准确。

技术实现思路

[0003]针对上述现有技术的缺点,本专利技术提供一种文本情感分析的方法、装置、设备和存储介质,以提供一种更准确的文本情感分析的方案。
[0004]本申请第一方面提供一种文本情感分析的方法,包括:
[0005]获得待处理文本,并分割所述待处理文本,得到多个待处理词汇;
[0006]针对每一个所述待处理词汇,根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量;
[0007]利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签。
[0008]可选的,所述分割所述待处理文本,得到多个待处理词汇,包括:
[0009]按预设的词库将所述待处理文本拆分为多个词汇;
[0010]从所述多个词汇中移除停用词和禁用词,并将剩余的词汇确定为待处理词汇。
[0011]可选的,所述根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量,包括:
[0012]根据所述待处理词汇的上下文文本确定所述待处理词汇的上下文特征;其中,所述待处理词汇的上下文文本包括所述待处理文本中在所述待处理文本之前的至多N个词汇和之后的至多N个词汇;
[0013]在所述待处理词汇对应的词性特征库中获取和所述待处理词汇的上下文特征相匹配的词性特征;
[0014]将所述待处理词汇的词性特征,和根据预训练的词向量模型确定的所述待处理词汇的第二词向量融合,得到所述待处理词汇的第一词向量。
[0015]可选的,所述利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签,包括:
[0016]利用预训练的情感分析网络的卷积层和池化层从所述文本矩阵提取得到所述待处理文本的多个文本特征;
[0017]利用所述情感分析网络的全连接层拼接所述多个文本特征,得到所述待处理文本
的综合文本特征;
[0018]利用所述情感分析网络的分类器计算所述综合文本特征,获得所述待处理文本的多个情感倾向概率;其中,每一个所述情感倾向概率均对应于一个预设的情感标签;
[0019]将最大的所述情感倾向概率对应的所述情感标签确定为所述待处理文本的情感标签。
[0020]本申请第二方面提供一种文本情感分析的装置,包括:
[0021]获得单元,用于获得待处理文本,并分割所述待处理文本,得到多个待处理词汇;
[0022]确定单元,用于针对每一个所述待处理词汇,根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量;
[0023]处理单元,用于利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签。
[0024]可选的,所述获得单元分割所述待处理文本,得到多个待处理词汇时,具体用于:
[0025]按预设的词库将所述待处理文本拆分为多个词汇;
[0026]从所述多个词汇中移除停用词和禁用词,并将剩余的词汇确定为待处理词汇。
[0027]可选的,所述确定单元根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量时,具体用于:
[0028]根据所述待处理词汇的上下文文本确定所述待处理词汇的上下文特征;其中,所述待处理词汇的上下文文本包括所述待处理文本中在所述待处理文本之前的至多N个词汇和之后的至多N个词汇;
[0029]在所述待处理词汇对应的词性特征库中获取和所述待处理词汇的上下文特征相匹配的词性特征;
[0030]将所述待处理词汇的词性特征,和根据预训练的词向量模型确定的所述待处理词汇的第二词向量融合,得到所述待处理词汇的第一词向量。
[0031]可选的,所述处理单元利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签时,具体用于:
[0032]利用预训练的情感分析网络的卷积层和池化层从所述文本矩阵提取得到所述待处理文本的多个文本特征;
[0033]利用所述情感分析网络的全连接层拼接所述多个文本特征,得到所述待处理文本的综合文本特征;
[0034]利用所述情感分析网络的分类器计算所述综合文本特征,获得所述待处理文本的多个情感倾向概率;其中,每一个所述情感倾向概率均对应于一个预设的情感标签;
[0035]将最大的所述情感倾向概率对应的所述情感标签确定为所述待处理文本的情感标签。
[0036]本申请第三方面提供一种电子设备,包括存储器和处理器;
[0037]其中,所述存储器用于存储计算机程序;
[0038]所述处理器用于执行所述计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的文本情感分析的方法。
[0039]本申请第四方面提供一种计算机存储介质,用于存储计算机程序,所述计算机程
序被执行时,具体用于实现本申请第一方面任意一项所提供的文本情感分析的方法。
[0040]本申请提供一种文本情感分析的方法、装置、设备和存储介质,可以应用于人工智能领域或金融领域,方法包括:获得待处理文本,并分割待处理文本,得到多个待处理词汇。针对每一个待处理词汇,根据待处理词汇的词性特征和预训练的第一词向量模型,确定待处理词汇的第一词向量;利用预训练的情感分析网络处理由各个待处理词汇的第一词向量构成的文本矩阵,获得表征待处理文本的情感倾向的情感标签。本方案能够根据词汇在具体语境的词性确定特定的词向量,从而提高后续分析得到的情感标签的准确度。
附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0042]图1为本申请实施例提供的一种文本情感分析的方法的流程图;
[0043]图2为本申请实施例提供的一种文本情感分析的装置的结构示意图;
[0044]图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0045]下面将结合本专利技术实施例中的附图,对本专利技术实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本情感分析的方法,其特征在于,包括:获得待处理文本,并分割所述待处理文本,得到多个待处理词汇;针对每一个所述待处理词汇,根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量;利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签。2.根据权利要求1所述的方法,其特征在于,所述分割所述待处理文本,得到多个待处理词汇,包括:按预设的词库将所述待处理文本拆分为多个词汇;从所述多个词汇中移除停用词和禁用词,并将剩余的词汇确定为待处理词汇。3.根据权利要求1所述的方法,其特征在于,所述根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇的第一词向量,包括:根据所述待处理词汇的上下文文本确定所述待处理词汇的上下文特征;其中,所述待处理词汇的上下文文本包括所述待处理文本中在所述待处理文本之前的至多N个词汇和之后的至多N个词汇;在所述待处理词汇对应的词性特征库中获取和所述待处理词汇的上下文特征相匹配的词性特征;将所述待处理词汇的词性特征,和根据预训练的词向量模型确定的所述待处理词汇的第二词向量融合,得到所述待处理词汇的第一词向量。4.根据权利要求1所述的方法,其特征在于,所述利用预训练的情感分析网络处理由各个所述待处理词汇的第一词向量构成的文本矩阵,获得表征所述待处理文本的情感倾向的情感标签,包括:利用预训练的情感分析网络的卷积层和池化层从所述文本矩阵提取得到所述待处理文本的多个文本特征;利用所述情感分析网络的全连接层拼接所述多个文本特征,得到所述待处理文本的综合文本特征;利用所述情感分析网络的分类器计算所述综合文本特征,获得所述待处理文本的多个情感倾向概率;其中,每一个所述情感倾向概率均对应于一个预设的情感标签;将最大的所述情感倾向概率对应的所述情感标签确定为所述待处理文本的情感标签。5.一种文本情感分析的装置,其特征在于,包括:获得单元,用于获得待处理文本,并分割所述待处理文本,得到多个待处理词汇;确定单元,用于针对每一个所述待处理词汇,根据所述待处理词汇的词性特征和预训练的第一词向量模型,确定所述待处理词汇...

【专利技术属性】
技术研发人员:周莹莹
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1