文本属性词情感分类方法、装置、设备和介质制造方法及图纸

技术编号:38722291 阅读:12 留言:0更新日期:2023-09-08 23:16
本公开提供了一种文本属性词情感分类方法、装置、设备和介质,涉及自然语言处理技术领域。该方法包括:获取文本数据;确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,目标句子为文本数据中的任意一个句子,属性词的属性句法距离为句子中与属性词关联的上下文词构成的词对与属性词在句法结构上的距离;将目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出目标句子中属性词的情感分类结果。本公开增强属性词情感分类模型对文本数据中属性词及其相关信息的感知能力,从而更准确地判别文本数据中属性词的情感类别。判别文本数据中属性词的情感类别。判别文本数据中属性词的情感类别。

【技术实现步骤摘要】
文本属性词情感分类方法、装置、设备和介质


[0001]本公开涉及自然语言处理
,尤其涉及一种文本属性词情感分类方法、装置、设备和介质。

技术介绍

[0002]属性级情感分类旨在识别句子中属性词的情感极性,是当前自然语言处理领域的研究热点之一,也是实现强人工智能和智能问答的关键技术。例如,商品供应商可以利用属性级情感分类方法从大量的用户文本评论中识别人们对某一产品或者产品的属性的褒贬评价,从而对产品进行针对性的改进,减少人工调研和分析的成本。
[0003]基于传统的统计机器学习的方法利用统计机器模型,例如,支持向量机SVM和最大熵模型,来挖掘属性词的情感极性,但是此类方法严重依赖于人工设计的特征好坏,非常耗时耗力。
[0004]基于深度学习的方法能够自动地学习适合于具体任务的相关特征,随着层数的加深能够生成更加抽象的特征。在属性级情感分类中,长短期记忆网络LSTM、门控学习单元GRU和卷积神经网络CNN等神经网络得到了广泛应用并获得了较好的表现。
[0005]近年来,大规模属性词情感分类模型BERT在多个自然语言处理任务中获得巨大成功,但此类方法仍存在一些不足。例如,BERT无法针对句子中的不同属性词捕捉不同的上下文和情感信息;无法在学习过程中不断更新属性相关句的句子语义信息;建模句子中属性词依赖的句法信息的能力较弱,没有显式地建模和学习属性词相关的句法知识。
[0006]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0007]本公开提供一种文本属性词情感分类方法、装置、设备和介质,至少在一定程度上克服相关技术中需要依赖大量人工标注数据且缺乏对文本数据中属性词机器相关信息的感知能力,而无法准确判别文本数据中属性词的情感类别的问题。
[0008]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0009]根据本公开的一个方面,提供了一种文本属性词情感分类方法,包括:获取文本数据,其中,所述文本数据包括多个句子,每个句子包含多个词,所述多个词中包含属性词;确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,所述目标句子为所述文本数据中的任意一个句子,所述属性词的属性句法距离为所述句子中与所述属性词关联的上下文词构成的词对与所述属性词在句法结构上的距离;将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出所述目标句子中属性词的情感分类结果。
[0010]在一些实施例中,所述确定目标句子中属性词的属性句法距离,包括:确定目标句
子中的属性词;确定所述目标句子中所述属性词对应的第一单词和第二单词,其中,所述第一单词为所述句子中出现在所述属性词的上文信息中的单词,所述第二单词为所述句子中出现在所述属性词的下文信息中的单词;计算第一单词与所述属性词的第一属性句法距离;计算第二单词与所述属性词的第二属性句法距离;根据所述第一属性句法距离、第二属性句法距离,确定属性词的属性句法距离。
[0011]在一些实施例中,通过如下公式得到目标句子中属性词的属性句法距离:
[0012][0013]其中,表示表示句子中第i个词、第j个词构成的词对与属性词之间的属性句法距离,l
i
表示第i个词与属性词连接得到的跳数,l
j
表示第j个词与属性词连接得到的跳数,k表示预先设定的跳数阈值,[pad]表示当第i个词和第j个词与属性词在句法结构中无关联关系时的属性距离向量,con(i,j)=1表示第i个词和第j个词与属性词在句法结构中有关联关系,con(i,j)=0表示第i个词和第j个词与属性词在句法结构中无关联关系。
[0014]在一些实施例中,所述属性词情感分类模型包括:嵌入层、属性词及句法适配层、动态语义调整层和属性词情感预测层,其中,所述嵌入层用于根据目标句子中每个词的上下文信息、属性词和属性词的属性句法距离,生成目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量;所述属性词及句法适配层用于根据所述目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量,生成所述目标句子中每个词对应的属性句法感知向量;所述动态语义调整层用于根据所述目标句子中每个词对应的属性句法感知向量,生成属性相关句对应的句子向量;所述属性词情感预测层用于根据所述属性相关句对应的句子向量,生成所述目标句子中属性词的情感分类结果。
[0015]在一些实施例中,所述将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出所述目标句子中属性词的情感分类结果,包括:根据所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,生成所述目标句子中每个词对应的属性句法感知向量;根据所述目标句子中每个词对应的属性句法感知向量,生成属性相关句对应的句子向量;根据所述属性相关句对应的句子向量,生成所述目标句子中属性词的情感分类结果。
[0016]在一些实施例中,通过如下公式得到所述目标句子中属性词的情感分类结果:
[0017]p=Softmax(W
p
h
m
+b
p
)
[0018]h
m
=Relu(W
m
h
b
+b
m
)
[0019]其中,表示输出属性词对应的情感类别对应的概率,表示情感极性分布图,包括情感类别数量及其对应的概率,K表示情感类别的数量,h
m
表示计算的中间量,h
b
表示属性相关句对应的句子向量,Softmax函数和Relu函数表示激活函数,W
m
、W
p
、b
m
和b
p
表示情感预测层的学习参数。
[0020]在一些实施例中,所述方法还包括:基于注意力机制,将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出所述目标句子中属性词的情感分类结果。
[0021]根据本公开的另一个方面,还提供了一种文本属性词情感分类装置,包括:文本数据获取模块,用于获取文本数据,其中,所述文本数据包括多个句子,每个句子包含多个词,所述多个词中包含属性词;数据向量确定模块,用于确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,所述目标句子为所述文本数据中的任意一个句子,所述属性词的属性句法距离为所述句子中与所述属性词关联的上下文词构成的词对与所述属性词在句法结构上的距离;情感分类结果输出模块,用于将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本属性词情感分类方法,其特征在于,包括:获取文本数据,其中,所述文本数据包括多个句子,每个句子包含多个词,所述多个词中包含属性词;确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,所述目标句子为所述文本数据中的任意一个句子,所述属性词的属性句法距离为所述句子中与所述属性词关联的上下文词构成的词对与所述属性词在句法结构上的距离;将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出所述目标句子中属性词的情感分类结果。2.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述确定目标句子中属性词的属性句法距离,包括:确定目标句子中的属性词;确定所述目标句子中所述属性词对应的第一单词和第二单词,其中,所述第一单词为所述句子中出现在所述属性词的上文信息中的单词,所述第二单词为所述句子中出现在所述属性词的下文信息中的单词;计算第一单词与所述属性词的第一属性句法距离;计算第二单词与所述属性词的第二属性句法距离;根据所述第一属性句法距离、第二属性句法距离,确定属性词的属性句法距离。3.根据权利要求2所述的文本属性词情感分类方法,其特征在于,通过如下公式得到目标句子中属性词的属性句法距离:其中,表示表示句子中第i个词、第j个词构成的词对与属性词之间的属性句法距离,l
i
表示第i个词与属性词连接得到的跳数,l
j
表示第j个词与属性词连接得到的跳数,k表示预先设定的跳数阈值,[pad]表示当第i个词和第j个词与属性词在句法结构中无关联关系时的属性距离向量,con(i,j)=1表示第i个词和第j个词与属性词在句法结构中有关联关系,con(i,j)=0表示第i个词和第j个词与属性词在句法结构中无关联关系。4.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述属性词情感分类模型包括:嵌入层、属性词及句法适配层、动态语义调整层和属性词情感预测层,其中,所述嵌入层用于根据目标句子中每个词的上下文信息、属性词和属性词的属性句法距离,生成目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量;所述属性词及句法适配层用于根据所述目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量,生成所述目标句子中每个词对应的属性句法感知向量;所述动态语义调整层用于根据所述目标句子中每个词对应的属性句法感知向量,生成属性相关句对应的句子向量;所述属性词情感预测层用于根据所述属性相关句对应的句子向量,生成所述目标句子中属性词的情感分类结果。5.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预...

【专利技术属性】
技术研发人员:刘宁
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1