【技术实现步骤摘要】
一种融合知识图谱的文本立场分析方法、系统及存储介质
本专利技术涉及互联网
,尤其涉及一种融合知识图谱的文本立场分析方法、系统及存储介质。
技术介绍
文本立场分析是研究社交媒体舆论动向及辅助商业决策的重要技术。文本立场分析的主要任务是针对给定对象,分析一段文本对该对象表达的情感倾向性(正面/负面/无立场)。例1,对象:华为公司,文本:海思真的是5G芯片先驱企业,立场:正面。该任务的主要挑战是给定对象不一定会出现在文本中,同时需要推断文本中出现的对象与给定对象之间的关系(如上例中“华为”与“海思”的关系)。传统文本立场分析技术主要依赖文本中词语浅层语义信息,即便现阶段性能最佳的神经网络模型都是只利用词频及共现特征。这些单纯基于文本特征的方法忽略了文本背后的大规模背景知识,导致现阶段针对特定对象的立场分析性能不佳。为此,我们需要将外部大规模知识图谱中的信息融入文本立场检测中。现阶段融合外部知识图谱的文本分析方法通常将外部知识图谱中的实体进行向量化后直接作为额外特征,将实体向量拼接与词与表示拼接作为特征。这一方 ...
【技术保护点】
1.一种融合知识图谱的文本立场分析方法,其特征在于,包括如下步骤:/n步骤1:使用文本向量表示工具将文本与对象表示为向量形式;/n步骤2:使用实体链接工具找到文本中出现的实体,并将实体链接至知识图谱中;/n步骤3:针对文本中出现的每个实体,建立一个单视角网络对该实体与给定对象以及文本进行建模,得到对应实体的单视角表示向量;/n步骤4:将步骤3中到的N个单视角表示向量输入双向循环神经网络中,得到N个多视角融合表示向量;/n步骤5:使用多视角注意力网络筛选多视角表示向量,得到最终用于分类的向量;/n步骤6:使用分类器对分类的向量进行分类,得到立场类标。/n
【技术特征摘要】
1.一种融合知识图谱的文本立场分析方法,其特征在于,包括如下步骤:
步骤1:使用文本向量表示工具将文本与对象表示为向量形式;
步骤2:使用实体链接工具找到文本中出现的实体,并将实体链接至知识图谱中;
步骤3:针对文本中出现的每个实体,建立一个单视角网络对该实体与给定对象以及文本进行建模,得到对应实体的单视角表示向量;
步骤4:将步骤3中到的N个单视角表示向量输入双向循环神经网络中,得到N个多视角融合表示向量;
步骤5:使用多视角注意力网络筛选多视角表示向量,得到最终用于分类的向量;
步骤6:使用分类器对分类的向量进行分类,得到立场类标。
2.根据权利要求1所述的文本立场分析方法,其特征在于,所述步骤2包括:
步骤2.1:通过自动实体链接工具对文本中提到的实体进行抽取;
步骤2.2:使用TransD实体表示模型将实体表示为向量表示。
3.根据权利要求1所述的文本立场分析方法,其特征在于,所述步骤3包括:
步骤3.1:将实体对应的实体Trand向量与文本中每个词的ELMo向量拼接,同时拼接该词语实体相对位置的编码向量p_i,得到一组文本表示向量;
步骤3.2:将对象对应实体的Trand向量与对象对应的ELMo向量拼接,得到对象表示向量;
步骤3.3:使用自注意力网络对这一组文本表示向量进行处理,得到整段文本的表示向量;
步骤3.4:使用另一个注意力网络对整段文本表示向量与对象表示向量进行融合,得到单视角表示向量。
4.根据权利要求1所述的文本立场分析方法,其特征在于,所述步骤5包括:
步骤5.1:使用多视角自注意力网络对N个多视角融合表示向量处理,得到N个多视角自注意力向量表示;
步骤5.2:使用多视角交叉注意力网络对N个多视角自注意力向量以及对象表示向量处理,得到1个多视角交叉注意力向量表示,从而得到最终用于分类的向量。
5.根据权利要求4所述的文本立场分析方法,其特征在于,在所述步骤6中,使用分类器对多视角交叉注意力向量进行分类,得到立场类标。
6.一种融合知识图谱的文本立场分析系统,其特征在于,包括:
文本嵌入表示模块:用于使用文本向量表...
【专利技术属性】
技术研发人员:徐睿峰,杜嘉晨,杨敏,范创,梁斌,黄锦辉,
申请(专利权)人:哈尔滨工业大学深圳,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。