网络舆情的分类方法、装置、电子装置和存储介质制造方法及图纸

技术编号:28321013 阅读:16 留言:0更新日期:2021-05-04 13:01
本申请涉及一种网络舆情的分类方法、装置、电子装置和存储介质。其中,该网络舆情的分类方法包括:获取第一待分析网站中的第一舆情文本信息;将第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与第一舆情文本信息对应的第一目标舆情类别,其中,训练完备的舆情文本信息分类模型是基于k‑means聚类算法训练的,被训练为根据舆情文本信息确定该舆情文本信息的舆情类别;根据第一目标舆情类别,将第一舆情文本信息分类到与第一目标舆情类别对应的第一目标舆情类别数据库中。通过本申请,解决了相关技术中网络舆情的风险判别率低的问题,提高了网络舆情的风险判别率。

【技术实现步骤摘要】
网络舆情的分类方法、装置、电子装置和存储介质
本申请涉及网络安全领域,特别是涉及网络舆情的分类方法、装置、电子装置和存储介质。
技术介绍
近年来,网络舆情对网络安全领域的影响与日俱增,伴随着一些网络舆情事件,用户开始认识到网络舆情重要性。同时,网络舆情突发事件如果处理不当,极有可能给用户带来一些经济损失,以及造成了对网络安全构成威胁。在相关技术中,大部分的舆情监测需要花费大量的技术人工成本去进行分类和维护,且舆情文本信息的正负面分类不够明确,使得对网络舆情分析不到位,不能及时的得到风险类的舆情。目前针对相关技术中因网络舆情的风险判别率低,而导致网络安全性低的问题,尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种网络舆情的分类方法、装置、电子装置和存储介质,以至少解决相关技术中网络舆情的风险判别率低的问题。第一方面,本申请实施例提供了一种网络舆情的分类方法,包括:获取第一待分析网站中的第一舆情文本信息;将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的第一目标舆情类别,其中,所述训练完备的舆情文本信息分类模型是基于k-means聚类算法训练的,被训练为根据舆情文本信息确定该舆情文本信息的舆情类别;根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中。在其中一些实施例中,将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的舆情类别之前,所述方法还包括:对所述第一舆情文本信息进行预处理,其中,所述预处理包括:信息过滤、信息补全和信息去重。在其中一些实施例中,根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中之后,所述方法还包括:获取第二待分析网站中的第二舆情文本信息;判断所述第二舆情文本信息与所述第一舆情文本信息的相似度是否大于预设值;在判断到所述第二舆情文本信息与所述第一舆情文本信息的相似度大于预设值的情况下,将所述第二舆情文本信息分类到所述第一目标舆情类别数据库中。在其中一些实施例中,判断所述第二舆情文本信息与所述第一舆情文本信息的相似度是否大于预设值之后,所述方法还包括:在判断到所述第二舆情文本信息与所述第一舆情文本信息的相似度不大于预设值的情况下,将所述第二舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第二舆情文本信息对应的第二目标舆情类别;根据所述第二目标舆情类别,将所述第二舆情文本信息分类到与所述第二目标舆情类别对应的第二目标舆情类别数据库中。在其中一些实施例中,根据所述第二目标舆情类别,将所述第二舆情文本信息分类到与所述第二目标舆情类别对应的第二目标舆情类别数据库中之后,所述方法还包括:获取第三待分析网站中的第三舆情文本信息;基于K-最近邻分类算法,确定第三舆情文本信息第一目标舆情类别数据库的第一距离值,以及确定第四舆情文本信息第二目标舆情类别数据库的第二距离值;在所述第一距离值小于所述第二距离值情况下,将所述第三舆情文本信息分类到所述第一目标舆情类别数据库中。在其中一些实施例中,在所述第一距离值大于所述第二距离值情况下,将所述第三舆情文本信息分类到所述第二目标舆情类别数据库中。在其中一些实施例中,所述训练完备的舆情文本信息分类模型的训练过程包括:获取多个舆情文本信息样本和初始舆情文本信息分类模型;从多个所述舆情文本信息样本中选取预设阈值个所述舆情文本信息样本作为初始聚类中心;确定多个所述舆情文本信息样本与所述预设阈值个初始聚类中心之间的最小距离;根据所述最小距离,训练所述初始舆情文本信息分类模型,直至收敛,得到训练完备的舆情文本信息分类模型。第二方面,本申请实施例还提供了一种网络舆情的分类装置,包括:第一获取模块,用于获取第一待分析网站中的第一舆情文本信息;第一输入模块,用于将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的第一目标舆情类别,其中,所述训练完备的舆情文本信息分类模型是基于k-means聚类算法训练的,被训练为根据舆情文本信息确定该舆情文本信息的舆情类别;第一分类模块,用于根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中。第三方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的网络舆情的分类方法。第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的网络舆情的分类方法。相比于相关技术,本申请实施例提供的网络舆情的分类方法、装置、电子装置和存储介质,通过获取第一待分析网站中的第一舆情文本信息;将第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与第一舆情文本信息对应的第一目标舆情类别,其中,训练完备的舆情文本信息分类模型是基于k-means聚类算法训练的,被训练为根据舆情文本信息确定该舆情文本信息的舆情类别;根据第一目标舆情类别,将第一舆情文本信息分类到与第一目标舆情类别对应的第一目标舆情类别数据库中的方式,解决了相关技术中网络舆情的风险判别率低的问题,提高了网络舆情的风险判别率。本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的网络舆情的分类方法的终端的硬件结构框图;图2是根据本申请实施例的网络舆情的分类方法的流程图;图3是根据本申请实施例的网络舆情的分类装置的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不本文档来自技高网
...

【技术保护点】
1.一种网络舆情的分类方法,其特征在于,包括:/n获取第一待分析网站中的第一舆情文本信息;/n将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的第一目标舆情类别,其中,所述训练完备的舆情文本信息分类模型是基于k-means聚类算法训练的,所述训练完备的舆情文本信息分类模型被训练为用于根据舆情文本信息确定该舆情文本信息的舆情类别;/n根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中。/n

【技术特征摘要】
1.一种网络舆情的分类方法,其特征在于,包括:
获取第一待分析网站中的第一舆情文本信息;
将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的第一目标舆情类别,其中,所述训练完备的舆情文本信息分类模型是基于k-means聚类算法训练的,所述训练完备的舆情文本信息分类模型被训练为用于根据舆情文本信息确定该舆情文本信息的舆情类别;
根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中。


2.根据权利要求1所述的网络舆情的分类方法,其特征在于,将所述第一舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第一舆情文本信息对应的舆情类别之前,所述方法还包括:
对所述第一舆情文本信息进行预处理,得到预处理之后的所述第一舆情文本信息,其中,所述预处理包括:信息过滤、信息补全和信息去重。


3.根据权利要求1所述的网络舆情的分类方法,其特征在于,根据所述第一目标舆情类别,将所述第一舆情文本信息分类到与所述第一目标舆情类别对应的第一目标舆情类别数据库中之后,所述方法还包括:
获取第二待分析网站中的第二舆情文本信息;
判断所述第二舆情文本信息与所述第一舆情文本信息的相似度是否大于预设值;
在判断到所述第二舆情文本信息与所述第一舆情文本信息的相似度大于预设值的情况下,将所述第二舆情文本信息分类到所述第一目标舆情类别数据库中。


4.根据权利要求3所述的网络舆情的分类方法,其特征在于,判断所述第二舆情文本信息与所述第一舆情文本信息的相似度是否大于预设值之后,所述方法还包括:
在判断到所述第二舆情文本信息与所述第一舆情文本信息的相似度不大于预设值的情况下,将所述第二舆情文本信息输入到训练完备的舆情文本信息分类模型中,得到与所述第二舆情文本信息对应的第二目标舆情类别;
根据所述第二目标舆情类别,将所述第二舆情文本信息分类到与所述第二目标舆情类别对应的第二目标舆情类别数据库中。


5.根据权利要求4所述的网络舆情的分类方法,其特征在于,根据所述第二目标舆情类别,将所述第二舆情文本信息分类...

【专利技术属性】
技术研发人员:沈嘉怡范渊杨勃
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1