一种基于语言学的网络舆情风险评估方法及装置制造方法及图纸

技术编号:41713784 阅读:34 留言:0更新日期:2024-06-19 12:42
本发明专利技术公开了一种基于语言学的网络舆情风险评估方法及装置,涉及舆情评估技术领域,本发明专利技术包括S1网络舆情收集,S2舆情数据归纳,对所收集的网络舆情信息进行分级归纳,S3舆情数据整理,对所归纳的数据进行清洗和预处理,S4关键词检索,通过哈希表进行快速查找,S5舆情分析评估:使用数据挖掘技术对进行数据分析和挖掘,S6评估结果总结,建立舆情风险评估系统。本发明专利技术通过主题分析算法从数据库中准确找到并分析出舆论重点,并生成舆情评估报告,本评估方法还可对所评估的舆情影响程度进行分级,便于查询者更加直观的掌握该舆情的现状以及未来影响趋势。

【技术实现步骤摘要】

本专利技术涉及舆情评估,特别涉及一种基于语言学的网络舆情风险评估方法及装置


技术介绍

1、舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度;

2、根据专利公开号为cn 108021651 b的专利技术专利提出的一种网络舆情风险评估方法及装置,方法包括:根据网络资源库中的网络资源进行数据采集,得到网络舆情数据;提取所述网络舆情数据的要素信息,根据各要素信息对所述网络舆情数据进行分析,得到分析结果;根据所述分析结果和关键词字典中的关键词,对所述网络舆情数据进行风险评估。本专利技术实施例通过设置网络资源块和关键词字典,根据网络资源库中的网络资源进行数据采集得到网络舆情数据后,进行分析,并根据分析结果和关键词字典对网络舆情数据进行风险评估,不仅能够实时自动地完成风险评估,而且成本低、深度广、效率高、准确性高;

3、该评估方法通过关键词搜索的方式对舆情数据进行风险评估,这种评估方式缺少对舆本文档来自技高网...

【技术保护点】

1.一种基于语言学的网络舆情风险评估方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤S1中,所述网络舆情收集操作中,以爬虫技术为基础建立信息采集模型对网页内容进行抓取,将互联网上的网页下载到本地,形成一个互联网内容的镜像备份,在进行网页内容抓取时对具体内容进行处理筛选,所使用的爬虫框架包括调度器、URL管理器、网页下载器、网页解析器和应用程序,调度器用于调度管理器、下载器和解析器,URL管理器用于管理URL,防止重复抓取和循环抓取,网页下载器用于下载网页,并转换成字符串,网页解析器用于解析下载下来的字符串,且解析...

【技术特征摘要】

1.一种基于语言学的网络舆情风险评估方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s1中,所述网络舆情收集操作中,以爬虫技术为基础建立信息采集模型对网页内容进行抓取,将互联网上的网页下载到本地,形成一个互联网内容的镜像备份,在进行网页内容抓取时对具体内容进行处理筛选,所使用的爬虫框架包括调度器、url管理器、网页下载器、网页解析器和应用程序,调度器用于调度管理器、下载器和解析器,url管理器用于管理url,防止重复抓取和循环抓取,网页下载器用于下载网页,并转换成字符串,网页解析器用于解析下载下来的字符串,且解析字符串由html算法实现。

3.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s2中,所述舆情数据归纳操作中,使用决策树算法对数据集进行分割,构建树状模型,将数据集的各个具体模型数据与决策树的节点进行匹配对应,并对数据进行逐级分类和编号,使其处于待调用状态。

4.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s3中,所述舆情数据整理操作中,采用统计方法检测数值型属性,计算字段值的均值和标准差,基于每个字段的置信区间来识别异常字段和记录,将数据...

【专利技术属性】
技术研发人员:周品余叶宁沈天旸
申请(专利权)人:浙江警察学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1