舆情分析方法及装置制造方法及图纸

技术编号:16755742 阅读:44 留言:0更新日期:2017-12-09 02:11
本发明专利技术实施例提供了一种舆情分析方法及装置,通过采用分布式蜘蛛采集技术采集各站点数据,然后将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件,再自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息,能实现敏感舆情的有效预警,提高准确性和时效性,效率高。

Methods and devices for public opinion analysis

The embodiment of the invention provides a method and a device for the analysis of public opinion, through the use of distributed spider technology to collect the site data collection, and the site of the data clustering, the identification of the site of the hot events in the data, and then automatically extract the abstract hot events, the semantic orientation analysis hot events, public opinion information obtained by the hot events, to achieve effective early warning sensitive public opinion, improve the accuracy and timeliness, high efficiency.

【技术实现步骤摘要】
舆情分析方法及装置
本专利技术涉及计算机领域,尤其涉及一种舆情分析方法及装置。
技术介绍
在互联网高度发展的今天,网络舆情分析因为其网络舆情信息获取的快捷和准确,内容分析的确定,舆情响应的及时,已经发展为网络舆情分析的最为重要的手段。在网络舆情分析技术中,倾向性分析并不关注舆情分析的应用领域,仅用于对网络舆情的倾向性进行判断。倾向性分析又可以被分为基于语气词标注的倾向性分析,以及基于机器学习的倾向性分析。基于语气词标注的方法严重依赖于标注专家且不利用训练样本,其分类精度往往不如基于机器学习的方法。而现有的基于机器学习的倾向性分析方法又取决于训练集的大小与质量。由于已有的标注语料库的规模都很小,因而这类有监督的倾向性分析方法的效果仍然难以保证。
技术实现思路
本专利技术实施例的目的是提供一种舆情分析方法及装置,能实现敏感舆情的有效预警,提高准确性和时效性,效率高。为实现上述目的,本专利技术实施例提供了一种舆情分析方法,包括步骤:采用分布式蜘蛛采集技术采集各站点数据;将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件;自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所本文档来自技高网...
舆情分析方法及装置

【技术保护点】
一种舆情分析方法,其特征在于,包括步骤:采用分布式蜘蛛采集技术采集各站点数据;将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件;自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息。

【技术特征摘要】
1.一种舆情分析方法,其特征在于,包括步骤:采用分布式蜘蛛采集技术采集各站点数据;将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件;自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息。2.如权利要求1所述的舆情分析方法,其特征在于,所述采用分布式蜘蛛采集技术采集各站点数据具体为:定向监控网站及所述网站的更新频率;根据所述网站的敏感度、活跃度将各个目标信源进行权重赋值,根据不同的权重以不同的采集频率采集各个站点的数据。3.如权利要求1所述的舆情分析方法,其特征在于,所述自动抽取所述热点事件的摘要前还包括:通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势,统计媒体和网络名人的点评走势。4.如权利要求3所述的舆情分析方法,其特征在于,通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势具体为:采用关键词命中的方式获得所述热点事件在每一主要站点的倾向,根据所述每一主要站点的倾向获取所述热点事件在主要站点的动态走势。5...

【专利技术属性】
技术研发人员:晋彤李永康
申请(专利权)人:广州特道信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1