【技术实现步骤摘要】
文本属性词情感分类方法、装置、设备和介质
[0001]本公开涉及自然语言处理
,尤其涉及一种文本属性词情感分类方法、装置、设备和介质。
技术介绍
[0002]属性级情感分类旨在识别句子中属性词的情感极性,是当前自然语言处理领域的研究热点之一,也是实现强人工智能和智能问答的关键技术。例如,商品供应商可以利用属性级情感分类方法从大量的用户文本评论中识别人们对某一产品或者产品的属性的褒贬评价,从而对产品进行针对性的改进,减少人工调研和分析的成本。
[0003]基于传统的统计机器学习的方法利用统计机器模型,例如,支持向量机SVM和最大熵模型,来挖掘属性词的情感极性,但是此类方法严重依赖于人工设计的特征好坏,非常耗时耗力。
[0004]基于深度学习的方法能够自动地学习适合于具体任务的相关特征,随着层数的加深能够生成更加抽象的特征。在属性级情感分类中,长短期记忆网络LSTM、门控学习单元GRU和卷积神经网络CNN等神经网络得到了广泛应用并获得了较好的表现。
[0005]近年来,大规模属性词情感分类模型BERT在多个自然语言处理任务中获得巨大成功,但此类方法仍存在一些不足。例如,BERT无法针对句子中的不同属性词捕捉不同的上下文和情感信息;无法在学习过程中不断更新属性相关句的句子语义信息;建模句子中属性词依赖的句法信息的能力较弱,没有显式地建模和学习属性词相关的句法知识。
[0006]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人 ...
【技术保护点】
【技术特征摘要】
1.一种文本属性词情感分类方法,其特征在于,包括:获取文本数据,其中,所述文本数据包括多个句子,每个句子包含多个词,所述多个词中包含属性词;确定目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,其中,所述目标句子为所述文本数据中的任意一个句子,所述属性词的属性句法距离为所述句子中与所述属性词关联的上下文词构成的词对与所述属性词在句法结构上的距离;将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预先训练好的属性词情感分类模型中,输出所述目标句子中属性词的情感分类结果。2.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述确定目标句子中属性词的属性句法距离,包括:确定目标句子中的属性词;确定所述目标句子中所述属性词对应的第一单词和第二单词,其中,所述第一单词为所述句子中出现在所述属性词的上文信息中的单词,所述第二单词为所述句子中出现在所述属性词的下文信息中的单词;计算第一单词与所述属性词的第一属性句法距离;计算第二单词与所述属性词的第二属性句法距离;根据所述第一属性句法距离、第二属性句法距离,确定属性词的属性句法距离。3.根据权利要求2所述的文本属性词情感分类方法,其特征在于,通过如下公式得到目标句子中属性词的属性句法距离:其中,表示表示句子中第i个词、第j个词构成的词对与属性词之间的属性句法距离,l
i
表示第i个词与属性词连接得到的跳数,l
j
表示第j个词与属性词连接得到的跳数,k表示预先设定的跳数阈值,[pad]表示当第i个词和第j个词与属性词在句法结构中无关联关系时的属性距离向量,con(i,j)=1表示第i个词和第j个词与属性词在句法结构中有关联关系,con(i,j)=0表示第i个词和第j个词与属性词在句法结构中无关联关系。4.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述属性词情感分类模型包括:嵌入层、属性词及句法适配层、动态语义调整层和属性词情感预测层,其中,所述嵌入层用于根据目标句子中每个词的上下文信息、属性词和属性词的属性句法距离,生成目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量;所述属性词及句法适配层用于根据所述目标句子中每个词对应的上下文向量、属性词向量和属性词的属性句法距离向量,生成所述目标句子中每个词对应的属性句法感知向量;所述动态语义调整层用于根据所述目标句子中每个词对应的属性句法感知向量,生成属性相关句对应的句子向量;所述属性词情感预测层用于根据所述属性相关句对应的句子向量,生成所述目标句子中属性词的情感分类结果。5.根据权利要求1所述的文本属性词情感分类方法,其特征在于,所述将所述目标句子中每个词的上下文向量、属性词向量、属性词的属性句法距离向量,输入至预...
【专利技术属性】
技术研发人员:刘宁,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。