【技术实现步骤摘要】
本专利技术涉及舆情评估,特别涉及一种基于语言学的网络舆情风险评估方法及装置。
技术介绍
1、舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度;
2、根据专利公开号为cn 108021651 b的专利技术专利提出的一种网络舆情风险评估方法及装置,方法包括:根据网络资源库中的网络资源进行数据采集,得到网络舆情数据;提取所述网络舆情数据的要素信息,根据各要素信息对所述网络舆情数据进行分析,得到分析结果;根据所述分析结果和关键词字典中的关键词,对所述网络舆情数据进行风险评估。本专利技术实施例通过设置网络资源块和关键词字典,根据网络资源库中的网络资源进行数据采集得到网络舆情数据后,进行分析,并根据分析结果和关键词字典对网络舆情数据进行风险评估,不仅能够实时自动地完成风险评估,而且成本低、深度广、效率高、准确性高;
3、该评估方法通过关键词搜索的方式对舆情数据进行风险评估,
...【技术保护点】
1.一种基于语言学的网络舆情风险评估方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤S1中,所述网络舆情收集操作中,以爬虫技术为基础建立信息采集模型对网页内容进行抓取,将互联网上的网页下载到本地,形成一个互联网内容的镜像备份,在进行网页内容抓取时对具体内容进行处理筛选,所使用的爬虫框架包括调度器、URL管理器、网页下载器、网页解析器和应用程序,调度器用于调度管理器、下载器和解析器,URL管理器用于管理URL,防止重复抓取和循环抓取,网页下载器用于下载网页,并转换成字符串,网页解析器用于解析下载
...【技术特征摘要】
1.一种基于语言学的网络舆情风险评估方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s1中,所述网络舆情收集操作中,以爬虫技术为基础建立信息采集模型对网页内容进行抓取,将互联网上的网页下载到本地,形成一个互联网内容的镜像备份,在进行网页内容抓取时对具体内容进行处理筛选,所使用的爬虫框架包括调度器、url管理器、网页下载器、网页解析器和应用程序,调度器用于调度管理器、下载器和解析器,url管理器用于管理url,防止重复抓取和循环抓取,网页下载器用于下载网页,并转换成字符串,网页解析器用于解析下载下来的字符串,且解析字符串由html算法实现。
3.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s2中,所述舆情数据归纳操作中,使用决策树算法对数据集进行分割,构建树状模型,将数据集的各个具体模型数据与决策树的节点进行匹配对应,并对数据进行逐级分类和编号,使其处于待调用状态。
4.如权利要求1所述的一种基于语言学的网络舆情风险评估方法,其特征在于,在步骤s3中,所述舆情数据整理操作中,采用统计方法检测数值型属性,计算字段值的均值和标准差,基于每个字段的置信区间来识别异常字段和记录,将数据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。