一种数据处理方法以及设备技术

技术编号:28321002 阅读:45 留言:0更新日期:2021-05-04 13:01
本申请实施例公开一种数据处理方法以及设备,其中方法包括如下步骤:获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;根据所述词向量生成目标文本对应的第一文本向量;根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;根据所述第三文本向量,生成所述目标词汇的情感概率向量;根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。采用本申请,可以提高预测文本中词汇的情感类别的准确性。

【技术实现步骤摘要】
一种数据处理方法以及设备
本申请涉及互联网
,尤其涉及一种数据处理方法以及设备。
技术介绍
近年来,目标情感分析预测作为情感分析任务,已成为自然语言处理领域的研究热点之一。目标情感分析需要针对文本中不同的目标词汇来分析其情感极性,这不仅依赖于文本的上下文信息,同时也要考虑文本中不同目标的情感信息。例如句子“Goodfoodbutdreadfulserviceatthatrestaurant”,目标词“food”是积极情感,而目标词“service”则是消极情感。所以在同一个文本中不同的目标词可能会出现相反的情感极性。传统的情感分析方法中,文本中词汇的词向量的生成没有考虑单词之间相对位置的关系,同时,词向量可能非常长,同一句子中的不同目标往往被预测为相同的情感极性,导致目标情感分析结果的准确性大大降低。
技术实现思路
本申请实施例提供一种数据处理方法以及设备,可以提高预测文本中词汇的情感类别的准确性。本申请实施例一方面提供了一种数据处理方法,可包括:获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;根据所述词向量生成目标文本对应的第一文本向量;根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;根据所述第三文本向量,生成所述目标词汇的情感概率向量;根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。其中,所述获取目标文本中的词汇的词向量,包括:将所述目标文本输入词向量转换模型,统计目标文本中的词汇在检测窗口中出现的次数,通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。其中,所述根据所述词向量生成目标文本对应的第一文本向量,包括:将所述目标文本中的词汇的词向量作为卷积层的输入,通过卷积层进行卷积处理;将所述卷积处理后的词向量通过全连接层,生成与词向量的维度相同的第一文本向量。其中,所述根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量,包括:将所述第一文本向量和目标词向量相加,得到第二文本向量,所述第二文本向量与所述词向量的维度相同;将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果;将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理,得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量;所述分类网络模型包括第一块结构和第二块结构。其中,所述将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果,包括:将第二文本向量作为第一块结构的输入,将所述第二文本向量通过卷积处理,对通过卷积处理后的第二文本向量进行标准化处理,将标准化处理后的第二文本向量通过全连接层生成第一待处理文本向量;将所述第一待处理文本向量与所述第二文本向量相加得到第一向量卷积结果。其中,所述将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理,得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量,包括:将所述第一向量卷积结果作为第二块结构的输入,将所述第一向量卷积结果通过卷积处理,对通过卷积处理后的所述第一向量卷积结果进行标准化处理,将标准化处理后的所述第一向量卷积结果通过全连接层生成第二待处理文本向量;将所述第二待处理文本向量与所述第一向量卷积结果相加得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量。其中,所述根据所述第三文本向量,生成所述目标词汇的情感概率向量,包括:将所述第三文本向量的分量进行指数运算,根据所述分量的指数运算结果生成所述第三文本向量的分量对应的情感概率;根据所述分量对应的情感概率确定所述目标词汇的情感概率向量。其中,所述根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别,包括:当所述情感概率向量为一维向量时,将所述情感概率向量映射至情感类别对应的特征分数区间,生成情感概率向量对应的特征分数,根据所述特征分数确定所述目标词汇在所述目标文本中的情感类别;当所述情感概率向量为多维向量时,获取所述情感概率向量中分量的最大值,根据所述最大值确定所述目标词汇在所述目标文本中的情感类别。本申请实施例一方面提供了一种数据处理设备,可包括:词向量获取单元,用于获取目标文本中的词汇的词向量;目标词汇获取单元,用于从目标文本中获取具有情感特征的目标词汇;第一文本向量生成单元,用于根据所述词向量生成目标文本对应的第一文本向量;第三文本向量生成单元,用于根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;情感概率向量生成单元,用于根据所述第三文本向量,生成所述目标词汇的情感概率向量;情感类别确定单元,用于根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。其中,所述词向量获取单元具体用于:将所述目标文本输入词向量转换模型,统计目标文本中的词汇在检测窗口中出现的次数,通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。其中,所述第一文本向量生成单元具体用于:将所述目标文本中的词汇的词向量作为卷积层的输入,通过卷积层进行卷积处理;将所述卷积处理后的词向量通过全连接层,生成与词向量的维度相同的第一文本向量。其中,所述第三文本向量生成单元,包括:第二文本向量生成子单元,用于将所述第一文本向量和目标词向量相加,得到第二文本向量,所述第二文本向量与所述词向量的维度相同;第一卷积结果生成子单元,用于将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果;第二卷积结果生成子单元,用于将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理,得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量;所述分类网络模型包括第一块结构和第二块结构。其中,所述第一卷积结果生成子单元具体用于:将第二文本向量作为第一块结构的输入,将所述第二文本向量通过卷积处理,对通过卷积处理后的第二文本向量进行标准化处理,将标准化处理后的第二文本向量通过全连接层生成第一待处理文本向量;将所述第一待处理文本向量与所述第二文本向量相加得到第一向量卷积结果。其中,所述第二卷积结果生成子单元具体用于:将所述第一向量卷积结果作为第二块结构的输入,将所述第一向量卷积结果通过卷积处理,对通过卷积处理后的所述第本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;/n根据所述词向量生成目标文本对应的第一文本向量;/n根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;/n根据所述第三文本向量,生成所述目标词汇的情感概率向量;/n根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标文本中的词汇的词向量,从目标文本中获取具有情感特征的目标词汇;
根据所述词向量生成目标文本对应的第一文本向量;
根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量;
根据所述第三文本向量,生成所述目标词汇的情感概率向量;
根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。


2.根据权利要求1所述的方法,其特征在于,所述获取目标文本中的词汇的词向量,包括:
将所述目标文本输入词向量转换模型,统计目标文本中的词汇在检测窗口中出现的次数,通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。


3.根据权利要求1所述的方法,其特征在于,所述根据所述词向量生成目标文本对应的第一文本向量,包括:
将所述目标文本中的词汇的词向量作为卷积层的输入,通过卷积层进行卷积处理;
将所述卷积处理后的词向量通过全连接层,生成与词向量的维度相同的第一文本向量。


4.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量,对所述第二文本向量进行卷积处理,得到向量卷积结果,根据所述第二文本向量和所述向量卷积结果,生成第三文本向量,包括:
将所述第一文本向量和目标词向量相加,得到第二文本向量,所述第二文本向量与所述词向量的维度相同;
将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果;
将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理,得到第二向量卷积结果,将所述第二向量卷积结果确定为第三文本向量;
所述分类网络模型包括第一块结构和第二块结构。


5.根据权利要求4所述的方法,其特征在于,所述将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理,得到第一向量卷积结果,包括:
将第二文本向量作为第一块结构的输入,将所述第二文本向量通过卷...

【专利技术属性】
技术研发人员:刘巍
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1