一种基于知识图谱和深度学习的汽车舆情分析方法技术

技术编号:22974709 阅读:39 留言:0更新日期:2019-12-31 23:26
本发明专利技术涉及一种基于知识图谱和深度学习的汽车舆情分析方法,包括:汽车领域知识图谱构建步骤,利用汽车领域专家知识重构二维数据表结构,获得汽车领域知识图谱;文本预处理步骤,从互联网中抓取社交网络数据,通过无关信息识别分类器剔除无关信息,获取汽车相关网络数据,并对汽车相关网络数据添加情感标注;舆情模型训练步骤,基于汽车领域知识图谱和汽车相关网络数据生成词向量空间,基于所述词向量空间训练舆情预测卷积神经网络;舆情因子计算步骤,利用训练好的舆情预测卷积神经网络对待预测的汽车相关网络数据进行预测,计算舆情因子,实现汽车舆情多角度分析。与现有技术相比,本发明专利技术具有多角度细化分类统计用户的情感、预测能力强等优点。

【技术实现步骤摘要】
一种基于知识图谱和深度学习的汽车舆情分析方法
本专利技术涉及舆情分析
,尤其是涉及一种基于知识图谱和深度学习的汽车舆情分析方法。
技术介绍
舆情分析被广泛应用于新闻媒体、贴吧论坛等文本数据,是一种分析公众在有关话题上情绪与态度的重要手段。早期的舆情分析主要是基于词典的方法,即根据词典定义的规则分别计算各类情感值,以得分最大的情感类别作为最终结果。基于统计的方法是另一种主流思路,一般和机器学习算法如互信息、支持向量机、LDA主题模型等结合,涉及的流程主要包括非结构化数据的结构化表示,特征提取以及分类算法。以上两种方法都是从词语的角度出发,统计词频相关信息进而判断情感极性,词语之间的语义关系并没有被挖掘出来。目前主流的舆情分析一般与深度学习算法相结合,原因在于RNN能够发现序列之间的长距离依赖关系,而CNN能够挖掘邻近词之间的关系,弥补基于统计的方法的缺点。虽然通过诸多学者的不懈努力,在舆情领域已取得了一系列重要成果,但这些研究大量集中在对用户情感的判断,并不区分是针对用户自身的话题,还是针对特定的话题。这是因为用于研究的数据集本身便本文档来自技高网...

【技术保护点】
1.一种基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,包括:/n汽车领域知识图谱构建步骤,利用汽车领域专家知识重构二维数据表结构,获得汽车领域知识图谱;/n文本预处理步骤,从互联网中抓取社交网络数据,通过无关信息识别分类器剔除无关信息,获取汽车相关网络数据,并对所述汽车相关网络数据添加情感标注;/n舆情模型训练步骤,基于所述汽车领域知识图谱和汽车相关网络数据生成词向量空间,基于所述词向量空间训练舆情预测卷积神经网络;/n舆情因子计算步骤,利用训练好的舆情预测卷积神经网络对待预测的汽车相关网络数据进行预测,计算舆情因子,实现汽车舆情多角度分析。/n

【技术特征摘要】
1.一种基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,包括:
汽车领域知识图谱构建步骤,利用汽车领域专家知识重构二维数据表结构,获得汽车领域知识图谱;
文本预处理步骤,从互联网中抓取社交网络数据,通过无关信息识别分类器剔除无关信息,获取汽车相关网络数据,并对所述汽车相关网络数据添加情感标注;
舆情模型训练步骤,基于所述汽车领域知识图谱和汽车相关网络数据生成词向量空间,基于所述词向量空间训练舆情预测卷积神经网络;
舆情因子计算步骤,利用训练好的舆情预测卷积神经网络对待预测的汽车相关网络数据进行预测,计算舆情因子,实现汽车舆情多角度分析。


2.根据权利要求1所述的基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,所述汽车领域知识图谱构建包括节点构建和关系构建,
所述节点包括汽车公司节点、汽车节点和零配件节点,
所述关系包括汽车与公司之间的关系、汽车与汽车之间的关系以及汽车与零部件之间的关系。


3.根据权利要求1所述的基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,所述社交网络数据包括发帖者信息、帖子标题、帖子内容、阅读量、发帖时间和回帖信息。


4.根据权利要求1所述的基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,所述无关信息识别分类器通过以下步骤训练获得:
101)对抓取的社交网络数据进行抽样,利用关键词匹配算法从抽样样本中筛选出汽车领域相关信息和汽车领域无关信息,组成两类样本数据;
102)对样本数据分词,并剔除停用词,计算每条样本所有词语的文件逆文档词频,结合所述汽车领域知识图谱获取最终关键词;
103)采用机器学习算法,基于所述样本数据训练无关信息识别分类器。


5.根据权利要求4所述的基于知识图谱和深度学习的汽车舆情分析方法,其特征在于,所述通过无关信息识别分类器剔除无关信息具体为:
计算每条社交网络信息的最终关键词的文件逆文档词频,输入至无关信息识别分类器,得到各条社交网络信息的标签,从而剔除无关信息。


6.根据权利要求1所述的基于知识图谱和深度学习的汽车舆情分析方...

【专利技术属性】
技术研发人员:黄海量
申请(专利权)人:上海财经大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1