舆论信息的监控方法、装置及存储介质、计算机设备制造方法及图纸

技术编号:21089914 阅读:33 留言:0更新日期:2019-05-11 10:05
本发明专利技术提供一种舆论信息的监控方法、装置及存储介质、计算机设备,所述方法包括:获取社交媒体平台中的舆论信息,所述舆论信息包括舆论文本;从所述舆论文本中获取第一文本特征,生成第一文本特征向量;获取官方媒体平台中的官方媒体信息,所述官方媒体信息包括媒体信息文本;从所述媒体信息文本中获取第二文本特征,生成第二文本特征向量;根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控。上述方法实现对舆论信息的自动化监控,不需要人工维护情感词典,节约了人工成本。

Monitoring methods, devices, storage media and computer equipment of public opinion information

【技术实现步骤摘要】
舆论信息的监控方法、装置及存储介质、计算机设备
本专利技术涉及计算机
,具体而言,本专利技术涉及一种舆论信息的监控方法、装置及存储介质、计算机设备。
技术介绍
互联网技术的快速发展给人们提供了快捷便利的信息沟通,网络信息通过互联网为载体得以快速传播。社会舆论舆情由之前的纸质传播及电视广播转换为如今的网络传播。网络舆情与社会舆情相互依存,网络舆情发展趋势在一定程度上体现了社会舆情的发展趋势。因此,可通过研究网络舆情了解社会舆情导向。当前的网络舆情监控主要针对社交媒体文本进行关键词检索、情感分析等以实现舆情监控。传统的这种监控形式需要人工维护情感词典,造成人工成本过高。
技术实现思路
本专利技术提出一种舆论信息的监控方法、装置及存储介质、计算机设备,以实现对舆论信息的自动化监控,不需要人工维护情感词典,节约了人工成本。本专利技术提供以下方案:一种舆论信息的监控方法,包括:获取社交媒体平台中的舆论信息,所述舆论信息包括舆论文本;从所述舆论文本中获取第一文本特征,生成第一文本特征向量;获取官方媒体平台中的官方媒体信息,所述官方媒体信息包括媒体信息文本;从所述媒体信息文本中获取第二文本特征,生成第二文本特征向量;根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控。在一实施例中,所述获取社交媒体平台中的舆论信息,包括:获取多个所述社交媒体平台中公开分享或公共评论的信息,以形成所述舆论信息。在一实施例中,所述从所述舆论文本中获取第一文本特征,生成第一文本特征向量,包括:利用one-hot独热码方式对所述舆论文本进行编码;通过word2vector算法模型对编码后的所述舆论文本进行训练,以获取所述舆论文本对应的词向量;通过堆叠自编码方式对该词向量进行压缩,并从压缩后词向量中提取包含所述第一文本特征的所述第一文本特征向量。在一实施例中,所述从所述舆论文本中获取第一文本特征,生成第一文本特征向量之后,还包括:根据所述第一文本特征向量对所述舆论信息对应的用户进行聚类分析;根据所述聚类分析的结果获取所述舆论信息对应的用户群体;根据所述第一文本特征向量获取所述用户群体的中心文本特征向量;所述中心文本特征向量为所述用户群体对应的文本特征生成的文本特征向量;所述根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控,包括:根据余弦相似度算法,分别对每个所述用户群体对应的所述中心文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对所述舆论信息进行监控。在一实施例中,所述根据计算结果对所述舆论信息进行监控,包括:根据所述计算结果获取不同用户群体对所述官方媒体信息中不同类别信息的关注程度;根据所述关注程度确定所述不同用户群体对所述舆论信息的舆论导向,以对所述舆论信息进行监控。在一实施例中,所述舆论信息包括所述舆论文本的时间轴信息;所述官方媒体信息包括所述媒体信息文本的时间轴信息;所述根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控,包括:根据所述舆论文本的时间轴信息和所述媒体信息文本的时间轴信息获取时间上对应的每个时间段内的所述第一文本特征向量和所述第二文本特征向量;根据余弦相似度算法,对所述每个时间段内的所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果确定所述舆论信息随时间的变化趋势。在一实施例中,所述根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控,包括:根据余弦相似度算法计算所述第一文本特征向量和所述第二文本特征向量的余弦相似度值;通过所述余弦相似度值对所述舆论信息与所述官方媒体信息相似情况进行舆情监控;或,将所述余弦相似度值与预设值进行比较,若所述余弦相似度值小于所述预设值,则确定监控到的所述舆论信息与所述官方媒体信息不相似;若所述余弦相似度值大于或等于所述预设值,则确定监控到的所述舆论信息与所述官方媒体信息相似。一种舆论信息的监控装置,包括:第一获取模块,用于获取社交媒体平台中的舆论信息,所述舆论信息包括舆论文本;第一生成模块,用于从所述舆论文本中获取第一文本特征,生成第一文本特征向量;第二获取模块,用于获取官方媒体平台中的官方媒体信息,所述官方媒体信息包括媒体信息文本;第二生成模块,用于从所述媒体信息文本中获取第二文本特征,生成第二文本特征向量;监控模块,用于根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆情进行监控。一种存储介质,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述任一实施例所述的舆论信息的监控方法。一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据上述任一实施例所述的舆论信息的监控方法。上述实施例提供的舆论信息的监控方法,首先从社交媒体平台中获取舆论信息,提取舆论信息的舆论文本,并生成包含该舆论文本的第一文本特征向量。其次,从官方媒体平台中获取官方媒体信息,提取媒体信息文本,并生成包含该媒体信息文本的第二文本特征向量。进一步地,获取第一文本特征向量和第二文本特征向量的余弦相似度值,根据其余弦相似度值可对社交媒体平台的舆论信息进行监控。因此,该舆论信息的监控方法以官方媒体发布的官方媒体信息文本作为参照,对社交媒体平台上的舆论信息进行自动化监控,不需要人工维护情感词典,节约了人工成本。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术提供的一种舆论信息的监控方法的应用场景的一实施例中的结构示意图;图2为本专利技术提供的一种舆论信息的监控方法的一实施例中的方法流程图;图3为本专利技术提供的步骤S200的一实施例中的方法流程图;图4为本专利技术提供的一种舆论信息的监控方法的再一实施例中的方法流程图;图5为本专利技术提供的一种舆论信息的监控装置的一实施例中的结构框图;图6为本专利技术提供的一种计算机设备的一实施例中的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,这里使用的“第一”、“第二”仅用于区别同一技术特征,并不对该技术特征的顺序和数量等加以限定。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。本
技术人员可以理解,除非另外本文档来自技高网
...

【技术保护点】
1.一种舆论信息的监控方法,其特征在于,包括:获取社交媒体平台中的舆论信息,所述舆论信息包括舆论文本;从所述舆论文本中获取第一文本特征,生成第一文本特征向量;获取官方媒体平台中的官方媒体信息,所述官方媒体信息包括媒体信息文本;从所述媒体信息文本中获取第二文本特征,生成第二文本特征向量;根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控。

【技术特征摘要】
1.一种舆论信息的监控方法,其特征在于,包括:获取社交媒体平台中的舆论信息,所述舆论信息包括舆论文本;从所述舆论文本中获取第一文本特征,生成第一文本特征向量;获取官方媒体平台中的官方媒体信息,所述官方媒体信息包括媒体信息文本;从所述媒体信息文本中获取第二文本特征,生成第二文本特征向量;根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控。2.根据权利要求1所述的方法,其特征在于,所述获取社交媒体平台中的舆论信息,包括:获取多个所述社交媒体平台中公开分享或公共评论的信息,以形成所述舆论信息。3.根据权利要求1所述的方法,其特征在于,所述从所述舆论文本中获取第一文本特征,生成第一文本特征向量,包括:利用one-hot独热码方式对所述舆论文本进行编码;通过word2vector算法模型对编码后的所述舆论文本进行训练,以获取所述舆论文本对应的词向量;通过堆叠自编码方式对该词向量进行压缩,并从压缩后词向量中提取包含所述第一文本特征的所述第一文本特征向量。4.根据权利要求1所述的方法,其特征在于,所述从所述舆论文本中获取第一文本特征,生成第一文本特征向量之后,还包括:根据所述第一文本特征向量对所述舆论信息对应的用户进行聚类分析;根据所述聚类分析的结果获取所述舆论信息对应的用户群体;根据所述第一文本特征向量获取所述用户群体的中心文本特征向量;所述中心文本特征向量为所述用户群体对应的文本特征生成的文本特征向量;所述根据余弦相似度算法,对所述第一文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对舆论信息进行监控,包括:根据余弦相似度算法,分别对每个所述用户群体对应的所述中心文本特征向量和所述第二文本特征向量进行余弦相似度计算,根据计算结果对所述舆论信息进行监控。5.根据权利要求4所述的方法,其特征在于,所述根据计算结果对所述舆论信息进行监控,包括:根据所述计算结果获取不同用户群体对所述官方媒体信息中不同类别信息的关注程度;根据所述关注程度确定所述不同用户群体对所述舆论信息的舆论导向,以对所述舆论信息进行监控。6.根据权利要求4所述的方法,其特征在于,所述舆论信息包括所述舆论文本的时间轴...

【专利技术属性】
技术研发人员:王杰庄伯金王少军肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1