一种基于NLP的网络异常言论分析监测方法技术

技术编号:36934698 阅读:11 留言:0更新日期:2023-03-22 18:56
本发明专利技术涉及网络异常言论分析监测领域,具体涉及一种基于NLP的网络异常言论分析监测方法,包括:获取历史网络言论数据进行初始分类处理得到历史网络言论特征数据;利用所述历史网络言论特征数据基于NLP得到历史网络言论分类数据;利用所述历史网络言论分类数据建立词汇

【技术实现步骤摘要】
一种基于NLP的网络异常言论分析监测方法


[0001]本专利技术涉及网络异常言论分析监测领域,具体涉及一种基于NLP的网络异常言论分析监测方法。

技术介绍

[0002]网络日渐发达,日常生活中上网浏览各种网站逐渐成为主流,而各种网络留言交谈等行为却很难进行监管,同时,人工无法对全部网络言论进行逐个筛查,在某些特殊情况产生漏洞从而容易发生危害沟通或发布违法消息,因此亟需一种切实可行的方法对网络异常言论进行分析处理,进而得到实时监测结果。

技术实现思路

[0003]针对现有技术的不足,本专利技术提供了一种基于NLP的网络异常言论分析监测方法,通过基于NLP处理语句词汇,从而提升对待分析数据监测的准确性与监测效率。
[0004]为实现上述目的,本专利技术提供了一种基于NLP的网络异常言论分析监测方法,包括:获取历史网络言论数据进行初始分类处理得到历史网络言论特征数据;利用所述历史网络言论特征数据基于NLP得到历史网络言论分类数据;利用所述历史网络言论分类数据建立词汇

行为分析标准;利用待分析网络异常言论数据根据所述词汇

行为分析标准得到待分析网络异常言论监测结果。
[0005]优选的,所述获取历史网络言论数据进行初始分类处理得到历史网络言论特征数据包括:获取历史网络正常言论数据与历史网络异常言论数据;利用所述历史网络正常言论数据与历史网络异常言论数据作为历史网络言论数据;利用所述历史网络正常言论数据与历史网络异常言论数据进行非相关词汇去除处理得到历史网络正常言论特征数据与历史网络异常言论特征数据;利用所述历史网络正常言论特征数据与历史网络异常言论特征数据作为历史网络言论特征数据;其中,非相关词汇去除处理为删除历史网络言论数据中的语气词与助词。
[0006]优选的,利用所述历史网络言论特征数据基于NLP得到历史网络言论分类数据包括:利用所述历史网络言论特征数据的历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇与历史网络正常言论特征词汇关联结果;利用所述历史网络言论特征数据的历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果;
利用所述历史网络正常言论特征词汇、历史网络正常言论特征词汇关联结果、历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果作为历史网络言论分类数据。
[0007]进一步的,利用所述历史网络言论特征数据的历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇与历史网络正常言论特征词汇关联结果包括:利用所述历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇;获取历史网络正常言论特征数据对应的各单独语句中全部词汇作为历史网络正常言论特征词汇关联结果。
[0008]进一步的,利用所述历史网络言论特征数据的历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果包括:利用所述历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇;获取历史网络异常言论特征数据对应的各单独语句中全部词汇作为历史网络异常言论特征词汇关联结果。
[0009]优选的,利用所述历史网络言论分类数据建立词汇

行为分析标准包括:获取历史网络言论分类数据的历史网络正常言论特征词汇与历史网络言论分类数据的历史网络异常言论特征词汇中的相同词汇作为历史网络言论基础词汇集;利用所述历史网络言论分类数据的历史网络正常言论特征词汇关联结果与历史网络异常言论特征词汇关联结果作为词汇

行为初始分析模板;利用所述历史网络言论基础词汇集与词汇

行为初始分析模板作为词汇

行为分析标准。
[0010]优选的,利用待分析网络异常言论数据根据所述词汇

行为分析标准得到待分析网络异常言论监测结果包括:利用所述待分析网络异常言论数据根据所述词汇

行为分析标准得到待分析网络异常言论初始监测结果;利用所述待分析网络异常言论初始监测结果根据所述词汇

行为分析标准进行验证处理得到待分析网络异常言论初始监测验证结果;利用所述待分析网络异常言论初始监测验证结果得到待分析网络异常言论监测结果。
[0011]进一步的,利用所述待分析网络异常言论数据根据所述词汇

行为分析标准得到待分析网络异常言论初始监测结果包括:获取所述待分析网络异常言论数据与词汇

行为分析标准中词汇

行为初始分析模板的历史网络正常言论特征词汇关联结果的相似度作为第一相似度;获取所述待分析网络异常言论数据与词汇

行为分析标准中词汇

行为初始分析模板的历史网络异常言论特征词汇关联结果的相似度作为第二相似度;判断所述第一相似度与第二相似度的差值是否大于第一相似度与第二相似度的平均值,若是,则所述待分析网络异常言论初始监测结果为初步正常,否则,所述待分析网络异常言论初始监测结果为异常。
[0012]进一步的,利用所述待分析网络异常言论初始监测结果根据所述词汇

行为分析标准进行验证处理得到待分析网络异常言论初始监测验证结果包括:
当待分析网络异常言论初始监测结果为初步正常时,利用所述待分析网络异常言论初始监测结果对应的待分析网络异常言论数据进行非相关词汇去除处理得到待分析网络异常言论特征数据;利用所述待分析网络异常言论特征数据基于NLP得到待分析网络异常言论特征词汇;根据词汇

行为分析标准的历史网络言论基础词汇集对所述待分析网络异常言论特征词汇进行降重处理得到待分析网络异常言论词汇降重数据;判断所述待分析网络异常言论词汇降重数据与词汇

行为分析标准的历史网络异常言论特征词汇关联结果是否为强相关,若是,则所述待分析网络异常言论初始监测验证结果为异常,否则,所述待分析网络异常言论初始监测验证结果为误差;其中,降重处理为去除待分析网络异常言论特征词汇中的历史网络言论基础词汇集的词汇,所述强相关为待分析网络异常言论词汇降重数据与历史网络异常言论特征词汇关联结果的相似度大于0.6。
[0013]进一步的,利用所述待分析网络异常言论初始监测验证结果得到待分析网络异常言论监测结果包括:当待分析网络异常言论初始监测结果为异常时,所述待分析网络异常言论监测结果为异常;当待分析网络异常言论初始监测结果为初步正常时,判断待分析网络异常言论初始监测验证结果是否为异常,若是,则所述待分析网络异常言论监测结果为异常,否则,所述待分析网络异常言论监测结果为误差。
[0014]与最接近的现有技术相比,本专利技术具有的有益效果:应用了NLP对待监测数据进行处理,同时对待监测进行降噪处理,去除了会影响NLP处理的助词语气词等,并在整体监测方案中分为监测与验证两步,提升了监测速度与监测效率,其次在验证过程中对待分析数据二次处理,保证了与初本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP的网络异常言论分析监测方法,其特征在于,包括:获取历史网络言论数据进行初始分类处理得到历史网络言论特征数据;利用所述历史网络言论特征数据基于NLP得到历史网络言论分类数据;利用所述历史网络言论分类数据建立词汇

行为分析标准;利用待分析网络异常言论数据根据所述词汇

行为分析标准得到待分析网络异常言论监测结果。2.如权利要求1所述的一种基于NLP的网络异常言论分析监测方法,其特征在于,所述获取历史网络言论数据进行初始分类处理得到历史网络言论特征数据包括:获取历史网络正常言论数据与历史网络异常言论数据;利用所述历史网络正常言论数据与历史网络异常言论数据作为历史网络言论数据;利用所述历史网络正常言论数据与历史网络异常言论数据进行非相关词汇去除处理得到历史网络正常言论特征数据与历史网络异常言论特征数据;利用所述历史网络正常言论特征数据与历史网络异常言论特征数据作为历史网络言论特征数据;其中,非相关词汇去除处理为删除历史网络言论数据中的语气词与助词。3.如权利要求1所述的一种基于NLP的网络异常言论分析监测方法,其特征在于,利用所述历史网络言论特征数据基于NLP得到历史网络言论分类数据包括:利用所述历史网络言论特征数据的历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇与历史网络正常言论特征词汇关联结果;利用所述历史网络言论特征数据的历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果;利用所述历史网络正常言论特征词汇、历史网络正常言论特征词汇关联结果、历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果作为历史网络言论分类数据。4.如权利要求3所述的一种基于NLP的网络异常言论分析监测方法,其特征在于,利用所述历史网络言论特征数据的历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇与历史网络正常言论特征词汇关联结果包括:利用所述历史网络正常言论特征数据基于NLP得到历史网络正常言论特征词汇;获取历史网络正常言论特征数据对应的各单独语句中全部词汇作为历史网络正常言论特征词汇关联结果。5.如权利要求3所述的一种基于NLP的网络异常言论分析监测方法,其特征在于,利用所述历史网络言论特征数据的历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇与历史网络异常言论特征词汇关联结果包括:利用所述历史网络异常言论特征数据基于NLP得到历史网络异常言论特征词汇;获取历史网络异常言论特征数据对应的各单独语句中全部词汇作为历史网络异常言论特征词汇关联结果。6.如权利要求1所述的一种基于NLP的网络异常言论分析监测方法,其特征在于,利用所述历史网络言论分类数据建立词汇

行为分析标准包括:获取历史网络言论分类数据的历史网络正常言论特征词汇与历史网络言论分类数据的历史网络异常言论特征词汇中的相同词汇作为历史网络言论基础词汇集;
利用所述历史网络言论分类数据的历史网络正常言论特征词汇关联结果与历史网络异常言论特征词汇关联结果作为词汇

行为初始分析模板;利用所述历史网络言论基础词汇集与词汇

行为初始分析模板作为词汇

【专利技术属性】
技术研发人员:赵志庆侯玉柱张昊张雨铭威董席峰
申请(专利权)人:天津戎行集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1