一种情感倾向预测方法、装置、系统及存储介质制造方法及图纸

技术编号:23085125 阅读:19 留言:0更新日期:2020-01-11 01:10
本发明专利技术公开了一种基于图神经网络(GNN)的情感倾向预测方法、装置、系统及计算机存储介质。基于图神经网络的情感倾向预测方法包括:首先,获取一段文本信息;然后,将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;接下来,将该图形结构数据转化为由词之间相似度构成的邻接矩阵;随后通过情感分类模型对邻接矩阵进行情感倾向预测。这种情感倾向预测方法在处理长文本时,通过词和词之间地相似度,将文本信息转化为图形结构数据,一方面能够利用图神经网络的优势包含尽可能多的语义;另一方面通过将相近的词聚合在一起,也更易于提取到最有代表意义的情感倾向特征,使预测结果更为准确。

A method, device, system and storage medium of emotion tendency prediction

【技术实现步骤摘要】
一种情感倾向预测方法、装置、系统及存储介质
本专利技术涉及人工智能(ArtificialIntelligence,AI)
,尤其涉及一种基于图神经网络GNN的情感倾向预测方法、装置、系统及计算机存储介质。
技术介绍
情感分类是自然语言处理中一种常见的任务。具体来说,就是给出一段文本信息,使用情感分类模型预测该文本信息的情感倾向。目前,情感倾向预测方法大多基于词向量序列和卷积神经网络实现的。这种情感倾向预测方法,在前期对文本信息中的句子进行转化时,主要使用如下方法:首先,对句子进行分词,将提取到的词语转化为词向量;然后,将词向量按照词在句子中的位置顺序排列,构成句子矩阵。同理,将句子矩阵按照句子在文本中的位置顺序排列,构成文本矩阵。由此可见,这一过程类似于编码的过程,并没有太多提炼或精简的过程。而且,在这样得到的文本矩阵中,词的排列顺序和组合方式仅与语序相关而与语义无关。使用这种情感倾向预测方法对长文本信息进行处理时就会变得比较困难。因为当文本信息很长时,基于词向量序列的文本矩阵就会是个非常大的矩阵,且与情感倾向相关的词也会分散在文本矩阵的各个位置。这就会导致以下问题:1)当句子矩阵的大小超出神经网络能够处理的矩阵大小时,只能舍弃部分词向量,截取部分矩阵进行处理。这等同于,在进行情感倾向预测时,只用到了一句话的前段、中断或后段,此时发生语义缺失的可能性极大;2)即使句子矩阵的大小未超出神经网络能够处理的矩阵大小,由于情感倾向相关的词可能会分散在矩阵的各个位置,单个卷积窗口的大小所能覆盖的范围也会限制情感倾向特征提炼的准确性。
技术实现思路
众所周知,图神经网络GNN的一个基本思想是基于节点的局部邻节点信息对节点进行向量转化(embedding),就是通过神经网络来聚合每个节点及其周围节点的信息。因此图神经网络具有以下特点:1)节点在每一层都会有向量转化;2)模型可以达到任意深度;3)第零层节点的向量转化是其自身的输入特征向量。于是,本专利技术人就创造性地想到是否可以利用图神经网络的以上优势将长文本转化为以词为节点,以词之间相似性为边的一种图形结构,利用图神经网络模型进行情感倾向预测,这样不但可以去除重复的词,使文本矩阵得到精简包含更多不同的词,还能够使词按照语义聚合,更易于准确地提取相关情感倾向特征。基于以上专利技术思路,本专利技术实施例提供了一种基于图神经网络的情感倾向预测方法、装置、系统及计算机存储介质。根据本专利技术实施例第一方面,提供一种基于图神经网络的情感倾向预测方法,该方法包括:获取文本信息;将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;将图形结构数据转化为由词之间相似度构成的邻接矩阵;通过情感分类模型对邻接矩阵进行情感倾向预测。根据本专利技术一实施方式,将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据,包括:提取文本信息中的词;获取所提取的词之间的相似度;以所提取的词为节点,以词之间的相似度作为边构造图形结构数据。根据本专利技术一实施方式,获取所提取的词之间的相似度,包括:通过词向量转化工具获取所提取的词之间的相似度。根据本专利技术一实施方式,获取所提取的词之间的相似度,包括:通过使用词相似度计算方法进行建模获取所提取的词之间的相似度。根据本专利技术一实施方式,通过情感分类模型对邻接矩阵进行情感倾向预测,包括:通过卷积神经网络模型CNN对邻接矩阵进行特征提取以得到对应的压缩表示向量;将压缩表示向量经过全连接层和分类模型获得情感倾向预测结果。根据本专利技术实施例第二方面,一种基于图神经网络的情感倾向性预测装置,该装置包括:信息获取模块,用于获取文本信息;图形结构数据转化模块,用于将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;邻接矩阵转化模块,用于将图形结构数据转化为由词之间相似度构成的邻接矩阵;情感倾向预测模块,通过情感分类模型对邻接矩阵进行情感倾向预测。根据本专利技术一实施方式,图形结构数据转化模块,包括:词提取单元,用于提取文本信息中的词;相似度获取单元,用于获取所提取的词之间的相似度;图形结构数据构造单元,用于以所提取的词为节点,以词之间的相似度为边构造图形结构数据。根据本专利技术一实施方式,相似度获取单元,具体用于,通过词向量转化工具获取所提取的词之间的相似度。根据本专利技术一实施方式,相似度获取单元,具体用于,通过使用词相似度计算方法进行建模获取所提取的词之间的相似度。根据本专利技术一实施方式,情感倾向预测模块304,包括:特征提取单元,用于通过卷积神经网络模型CNN对邻接矩阵进行特征提取以得到对应的压缩表示向量;预测结果获得单元,用于将压缩表示向量经过全连接层和分类模型获得情感倾向预测结果根据本专利技术实施例第三方面,还提供一种基于图神经网络的情感倾向预测系统,包括处理器和存储器,其中,存储器中存储有计算机程序指令,计算机程序指令被处理器运行时用于执行上述任一项的情感倾向预测方法。根据本专利技术实施例第四方面,又提供一种计算机存储介质,存储介质包括一组计算机可执行指令,当指令被执行时用于执行上述任一项的情感倾向预测方法。本专利技术实施例基于图神经网络的情感倾向预测方法、装置、系统及计算机存储介质。首先,获取一段文本信息;然后,将文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;接下来,将该图形结构数据转化为由词之间相似度构成的邻接矩阵;随后通过情感分类模型对邻接矩阵进行情感倾向预测。这种情感倾向预测方法在处理长文本时,通过词和词之间地相似度,将文本信息转化为图形结构数据,一方面能够利用图神经网络的优势包含尽可能多的语义;另一方面通过将相近的词聚合在一起,也更易于提取到最有代表意义的情感倾向特征,使预测结果更为准确。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。图1为本专利技术实施例基于图神经网络的情感倾向预测方法的实现流程示意图;图2为本专利技术实施例基于图神经网络的情感倾向预测方法中的图形结构数据示意图;图3为本专利技术实施例基于图神经网络的情感倾向预测装置的组成结构示意图。具体实施方式为使本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在本文档来自技高网
...

【技术保护点】
1.一种基于图神经网络GNN的情感倾向性预测方法,其特征在于,所述方法包括:/n获取文本信息;/n将所述文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;/n将所述图形结构数据转化为由词之间相似度构成的邻接矩阵;/n通过情感分类模型对所述邻接矩阵进行情感倾向预测。/n

【技术特征摘要】
1.一种基于图神经网络GNN的情感倾向性预测方法,其特征在于,所述方法包括:
获取文本信息;
将所述文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据;
将所述图形结构数据转化为由词之间相似度构成的邻接矩阵;
通过情感分类模型对所述邻接矩阵进行情感倾向预测。


2.根据权利要求1所述的方法,其特征在于,所述将所述文本信息转化为以词为节点,以词之间的相似度为边的图形结构数据,包括:
提取所述文本信息中的词;
获取所提取的词之间的相似度;
以所提取的词为节点,以词之间的相似度为边构造图形结构数据。


3.根据权利要求2所述的方法,其特征在于,所述获取所提取的词之间的相似度,包括:
通过词向量转化工具获取所提取的词之间的相似度。


4.根据权利要求2所述的方法,其特征在于,所述获取所提取的词之间的相似度,包括:
通过使用词相似度计算方法进行建模获取所提取的词之间的相似度。


5.根据权利要求1所述的方法,其特征在于,所述通过情感分类模型对所述邻接矩阵进行情感倾向预测,包括:
通过卷积神经网络模型CNN对所述邻接矩阵进行特征提取以得到对应的压缩表示向量;
将所述压缩表示向量经过全连接层和分类模型获得情感倾向预测结果。

【专利技术属性】
技术研发人员:祝文博雷欣李志飞
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1