一种负面舆情指数的计算方法及系统技术方案

技术编号：12135992 阅读：93 留言：0更新日期：2015-09-30 18:40

本发明专利技术涉及一种负面舆情指数的计算方法及系统，包括步骤S1，对待分类文本进行基于情感词典的正负面分类和基于Mode l模型的SVM分类，分别得到分类结果1和分类结果2；步骤S2，若所述分类结果1与所述分类结果2的值都为负面，则认为待分类文本为负面，继续执行步骤S3；若所述分类结果1与所述分类结果2的值不都为负面，则认为待分类文本为非负面，计算结束；步骤S3，将待分类文本分别与用户标注负面词典和训练集关键词典匹配，分别得到负面指标1和负面指标2；步骤S4，将所述分类结果1、所述负面指标1和所述负面指标2进行线性组合，得到待分类文本的负面舆情指数。本发明专利技术计算出的负面舆情指数准确率高，计算语料范围广且能够实时计算。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及领域，尤其设及一种负面舆情指数的计算方法及系统。
技术介绍
据中国互联网络信息中屯、（CNNIC)统计，截止2014年12月，中国网民规模达6. 49 亿。互联网普及率达到47.9%，较2013年底提升了 2.1个百分点。2014年，中国网民的人均每周上网时长达26. 1小时，相比2013年底增加了 1. 1个小时。该说明互联网发展重屯、从"广泛"向"深入"转换，各项网络应用深刻改变网民生活。随着互联网的发展，互联网络作为社会舆论的工具，具有反应和引导社会舆论的功能。针对该种自由无序的网络舆情信息，网络舆情指数计算的导向作用显得日益强大。及时掌握舆情动态、积极引导社会舆情，是维护社会稳定的重要举措。因此，舆情指数计算是研究舆情监控、事态推演W及预测等技术的基础，研究负面舆情指数计算具有重要的理论和实际意义。负面舆情指数计算的理论方法主要是文本（本专利技术主要处理中文文本）分类中的二分类问题（负面与非负面），在文本分类中主要设及分词处理、特征选择、文本表示、文本分类算法、评价指标等。目前中国人民大学舆论研究所与百度合作，基于百度的海量捜索数据提出了中国冷暖度指数等14个舆情指数。他们认为捜索量的高低反映了民众对该关键词所代表事件的关注程度。百度每年汇总出全年捜索量最高和关注热度上升最快的前1000个捜索热词，由之可W较为粗略地"刻画"出中国网民关注中国社会的"素描图"。该种技术对热捜词做了综合的和整体式的解读，但如果对整个社会基本面的宏观把握和理解所需的周期太长，对一个事件的舆情判断至少需要数天、数...
一种负面舆情指数的计算方法及系统

【技术保护点】
一种负面舆情指数的计算方法，其特征在于，包括以下步骤：步骤S1，对待分类文本进行基于情感词典的正负面分类和基于Model模型的SVM分类，分别得到分类结果1和分类结果2；步骤S2，若所述分类结果1与所述分类结果2的值都为负面，则认为待分类文本为负面，继续执行步骤S3；若所述分类结果1与所述分类结果2的值不都为负面，则认为待分类文本为非负面，计算结束；步骤S3，将待分类文本分别与用户标注负面词典和训练集关键词典匹配，分别得到负面指标1和负面指标2；步骤S4，将所述分类结果1、所述负面指标1和所述负面指标2进行线性组合，得到待分类文本的负面舆情指数。

【技术特征摘要】

【专利技术属性】
技术研发人员：李雪梅，刘大伟，刘玮，王海洋，隋雪青，程学旗，戴鹏飞，
申请(专利权)人：烟台中科网络技术研究所，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人