风险言论识别分析的方法、系统、装置及可读存储介质制造方法及图纸

技术编号:40271502 阅读:24 留言:0更新日期:2024-02-02 22:57
本发明专利技术公开了一种风险言论识别分析的方法、系统装置及可读存储介质,方法包括:获取历史文本数据集,对历史文本数据集进行预处理,得到适用数据集;通过预设分词工具对适用数据集进行处理,得到词元,并对词元进行关键字标注,得到风险言论词库;构建风险言论识别预训练模型,基于风险言论词库对风险言论识别预训练模型进行训练,得到风险言论识别模型;将待识别文本数据输入风险言论识别模型,得到识别结果。本发明专利技术通过得到风险言论词库,并构建基于文本数据的风险言论识别模型识别待识别的语句,实现对复杂情况下的长文本数据流的识别和各种热点的分析,最终实现风险言论识别及对当下热点问题的分析,进而得到言论风险等级及相关热点话题。

【技术实现步骤摘要】

本专利技术涉及大数据算法处理,尤其涉及一种风险言论识别分析的方法、系统、装置及可读存储介质


技术介绍

1、在国家政务系统中,通过网上来信以及语音来信等各渠道来信汇集的信息,体量十分庞大,且群众的文化水平参差不齐,导致收到的各种信息中存在着语义杂乱、不标准、表达内容太长等对于复杂长文本而言难以处理的问题,单凭人工很难在巨量的信息中统计,很难分析出目前的热点问题以及蕴含的风险要素。现有的解决方法一般是通过人工进行整理和搜集,但这类方法存在严重的不足,耗费大量人力物力且效率低下,并且不能及时发现甚至提前研判在复杂的,多样的,海量的信息中包含的各种攻击性或者风险言论。


技术实现思路

1、本专利技术针对现有技术中的缺点,提供了一种风险言论识别分析的方法、系统、装置及可读存储介质。

2、为了解决上述技术问题,本专利技术通过下述技术方案得以解决:

3、一种风险言论识别分析的方法,包括以下步骤:

4、获取历史文本数据集,对所述历史文本数据集进行预处理,得到适用数据集;

5、通本文档来自技高网...

【技术保护点】

1.一种风险言论识别分析的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述对所述历史文本数据集进行预处理,得到适用数据集,包括以下步骤:

3.根据权利要求1所述的热点分析与风险言论评判的方法,其特征在于,还包括以下步骤:

4.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述预设分词工具的分词处理过程,包括以下步骤:

5.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述构建风险言论识别预训练模型,包括以下步骤:

6.根据权利要求1所述的风险言论识别分析的方法...

【技术特征摘要】

1.一种风险言论识别分析的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述对所述历史文本数据集进行预处理,得到适用数据集,包括以下步骤:

3.根据权利要求1所述的热点分析与风险言论评判的方法,其特征在于,还包括以下步骤:

4.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述预设分词工具的分词处理过程,包括以下步骤:

5.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述构建风险言论识别预训练模型,包括以下步骤:

6.根据权利要求1所述的风险言论识别分析的方法,其特征在于,所述基于所...

【专利技术属性】
技术研发人员:张舟洋吕泽淼张文强董晓龙杨镐泽
申请(专利权)人:浙江之科云创数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1