一种数据处理方法以及设备技术

技术编号：28321002 阅读：45 留言：0更新日期：2021-05-04 13:01

本申请实施例公开一种数据处理方法以及设备，其中方法包括如下步骤：获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；根据所述词向量生成目标文本对应的第一文本向量；根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；根据所述第三文本向量，生成所述目标词汇的情感概率向量；根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。采用本申请，可以提高预测文本中词汇的情感类别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法以及设备
本申请涉及互联网
，尤其涉及一种数据处理方法以及设备。
技术介绍
近年来，目标情感分析预测作为情感分析任务，已成为自然语言处理领域的研究热点之一。目标情感分析需要针对文本中不同的目标词汇来分析其情感极性，这不仅依赖于文本的上下文信息，同时也要考虑文本中不同目标的情感信息。例如句子“Goodfoodbutdreadfulserviceatthatrestaurant”，目标词“food”是积极情感，而目标词“service”则是消极情感。所以在同一个文本中不同的目标词可能会出现相反的情感极性。传统的情感分析方法中，文本中词汇的词向量的生成没有考虑单词之间相对位置的关系，同时，词向量可能非常长，同一句子中的不同目标往往被预测为相同的情感极性，导致目标情感分析结果的准确性大大降低。
技术实现思路
本申请实施例提供一种数据处理方法以及设备，可以提高预测文本中词汇的情感类别的准确性。本申请实施例一方面提供了一种数据处理方法，可包括：获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；根据所述词向量生成目标文本对应的第一文本向量；根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；根据所述第三文本向量，生成所述目标词汇的情感概率向量；根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；/n根据所述词向量生成目标文本对应的第一文本向量；/n根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；/n根据所述第三文本向量，生成所述目标词汇的情感概率向量；/n根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取目标文本中的词汇的词向量，从目标文本中获取具有情感特征的目标词汇；
根据所述词向量生成目标文本对应的第一文本向量；
根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量；
根据所述第三文本向量，生成所述目标词汇的情感概率向量；
根据所述情感概率向量确定所述目标词汇在所述目标文本中的情感类别。

2.根据权利要求1所述的方法，其特征在于，所述获取目标文本中的词汇的词向量，包括：
将所述目标文本输入词向量转换模型，统计目标文本中的词汇在检测窗口中出现的次数，通过所述词汇在检测窗口中出现的次数和词向量转换模型生成目标文本中的词汇的词向量。

3.根据权利要求1所述的方法，其特征在于，所述根据所述词向量生成目标文本对应的第一文本向量，包括：
将所述目标文本中的词汇的词向量作为卷积层的输入，通过卷积层进行卷积处理；
将所述卷积处理后的词向量通过全连接层，生成与词向量的维度相同的第一文本向量。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一文本向量和所述目标词汇的目标词向量生成第二文本向量，对所述第二文本向量进行卷积处理，得到向量卷积结果，根据所述第二文本向量和所述向量卷积结果，生成第三文本向量，包括：
将所述第一文本向量和目标词向量相加，得到第二文本向量，所述第二文本向量与所述词向量的维度相同；
将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理，得到第一向量卷积结果；
将所述第一向量卷积结果输入至分类网络模型中的第二块结构进行卷积处理，得到第二向量卷积结果，将所述第二向量卷积结果确定为第三文本向量；
所述分类网络模型包括第一块结构和第二块结构。

5.根据权利要求4所述的方法，其特征在于，所述将第二文本向量输入至分类网络模型中的第一块结构进行卷积处理，得到第一向量卷积结果，包括：
将第二文本向量作为第一块结构的输入，将所述第二文本向量通过卷...

【专利技术属性】
技术研发人员：刘巍，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人