一种基于大数据与神经网络的信息智能拦截方法技术

技术编号:28744016 阅读:8 留言:0更新日期:2021-06-06 17:24
本发明专利技术公开了一种基于大数据与神经网络的信息智能拦截方法,包括以下步骤:获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度;获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。本方法对包含网络链接、第三方平台账号的信息进行有效识别、降低漏拦概率的同时,减少对有些包含类垃圾信息关键词的非垃圾信息以及一些玩笑类信息误拦截现象的发生。信息以及一些玩笑类信息误拦截现象的发生。信息以及一些玩笑类信息误拦截现象的发生。

【技术实现步骤摘要】
一种基于大数据与神经网络的信息智能拦截方法


[0001]本专利技术涉及通讯
,尤其涉及一种基于大数据与神经网络的信息智能拦截方法。

技术介绍

[0002]随着网络登录与用户身份认证等安全性问题的不断渗透,信息行业迎来了复苏时期,2019年全国信息业务量比上年增长37.5%,增速提高了23.5个百分点,信息行业复苏与互联网的共同发展导致信息的内容与种类不再是单一的形式,网络链接、第三方平台账号、网络用语等内容出现在信息文本中,推销信息、淘宝刷单、传销散播等形式也层出不穷,现如今的信息拦截大部分采用关键词识别与匹配、信息中心黑名单匹配等技术,对于包含网络链接、第三方平台账号的信息不能进行有效的拦截,存在一定的漏拦概率,同时,有些包含类垃圾信息关键词的非垃圾信息以及一些玩笑类信息,采用当前的信息拦截技术会发生误拦截现象。
[0003]现有技术中通过获取待识别信息的发送方身份信息和信息文本数据;对关键词集合进行词向量处理并输入至关键词模型中得到M个标签,计算关键词标签与预设标签的匹配度,并根据设定的阈值进行判断得出信息的标签,根据该标签获得信息的属性,对于信息发送方信息为表征信息,如姓名、号码、地址等,该信息识别方法能够对待识别信息进行更为细致的标识,也即,能够对待识别信息进行更为细致的分类,通过对其更为细致的分类来提高分类的准确率,但是还是存在如下缺陷:对于含有网络链接、第三方平台账号的信息未进行有效的拦截,只获取发送方的姓名、号码与地址,未对发送方发送信息次数与信用度进行判断,存在误拦截的现象。

技术实现思路

[0004]本专利技术提供的一种基于大数据与神经网络的信息智能拦截方法,旨在解决现有技术中对于信息中包含的网络链接、第三方平台账号不能进行有效拦截或对信息进行误拦截的问题。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]本专利技术的一种基于大数据与神经网络的信息智能拦截方法,包括以下步骤:
[0007]获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;
[0008]获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度;
[0009]获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。
[0010]利用正则表达式进行信息文本的语义分析,获得关键词、网络链接、第三方平台账号的词向量等语义特征,通过多层神经网络模型对语义特征进行训练,快速的检测与判断
信息是否为垃圾信息的置信度,降低了漏拦截的概率,同时结合大数据对发送该垃圾信息的通讯方式进行发送垃圾信息次数和信用度的监测,进行综合判定,减少误拦截现象的发生。
[0011]作为优选,获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行并行训练,输出所述第一目标内容的第一置信度,包括:
[0012]利用正则表达式对所述待识别信息进行语义分析,获取所述待识别信息中第一目标内容的第一词向量,所述第一目标内容包含关键词、网络链接、第三方平台账号;
[0013]预设所述第二目标内容的第二词向量,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号,将所述第一词向量和第二词向量输入神经网络模型;
[0014]根据所述神经网络模型对所述第一、第二词向量进行求和与归一化处理,输出所述关键词、网络链接、第三方平台账号的第一置信度。
[0015]作为优选,获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度,包括:
[0016]利用大数据分析技术获取垃圾信息中包含所述第二目标内容的概率,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号;
[0017]将所述第一置信度和所述概率输入神经网络模型进行训练,获取所述待识别信息的第二置信度,所述待识别信息的第二置信度包含所述待识别信息是否为垃圾信息的置信度。
[0018]作为优选,获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截,包括:
[0019]根据大数据监测技术对发送所述待识别信息的通讯方式进行监测,获取所述通讯方式的过往信用记录,所述过往信用记录包含过去发送垃圾信息的次数及其信用度;
[0020]根据预先设置的置信度阈值、发送垃圾信息的次数阈值及信用度等级,与所述第二置信度、发送垃圾信息的次数及信用度进行比较,判断是否对所述待识别信息进行拦截;
[0021]当所述待识别信息的第二置信度大于等于设置的置信度阈值、发送垃圾信息的次数小于设置的发送次数阈值且信用度等级小于设置等级时,或当所述待识别信息是否为垃圾信息的置信度大于阈值且发送垃圾信息的次数大于设置阈值时,就对所述待识别信息进行拦截处理。
[0022]一种基于大数据与神经网络的信息智能拦截装置,包括:
[0023]词向量处理模块,用于获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行并行训练,输出所述第一目标内容的第一置信度;
[0024]第二置信度获取模块,用于获取垃圾信息中包含预设第二目标内容的概率,根据所述词向量处理模块输出的所述第一置信度和所述概率进行模型训练,输出所述待识别信息的第二置信度;
[0025]信息识别模块,用于获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度获取模块输出的所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。
[0026]作为优选,所述词向量处理模块包括:
[0027]第一词向量获取单元,用于利用正则表达式对所述待识别信息进行语义分析,获
取所述待识别信息中第一目标内容的第一词向量,所述第一目标内容包含关键词、网络链接、第三方平台账号;
[0028]第二词向量获取单元,用于预设所述第二目标内容的第二词向量,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号,将所述第二词向量和所述第一词向量获取单元获取的所述第一词向量输入神经网络模型;
[0029]模型处理单元,用于根据所述第二词向量获取单元输入的所述神经网络模型对所述第一、第二词向量进行求和与归一化处理,输出所述关键词、网络链接、第三方平台账号的第一置信度。
[0030]作为优选,所述第二置信度获取模块包括:
[0031]概率获取单元,用于利用大数据分析技术获取垃圾信息中包含所述第二目标内容的概率,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号;
[0032]模型训练单元,用于将所述第一置信度和所述概率获取单元获取的所述概率输入神经网络模型进行训练,获取所述待识别信息的第二置信度,所述待识别信息的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据与神经网络的信息智能拦截方法,其特征在于,包括:获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度;获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截。2.根据权利要求1所述的一种基于大数据与神经网络的信息智能拦截方法,其特征在于,获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度,包括:利用正则表达式对所述待识别信息进行语义分析,获取所述待识别信息中第一目标内容的第一词向量,所述第一目标内容包含关键词、网络链接、第三方平台账号;预设所述第二目标内容的第二词向量,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号,将所述第一词向量和所述第二词向量输入神经网络模型;根据所述神经网络模型对所述第一、第二词向量进行求和与归一化处理,输出所述关键词、网络链接、第三方平台账号的第一置信度。3.根据权利要求2所述的一种基于大数据与神经网络的信息智能拦截方法,其特征在于,获取垃圾信息中包含预设第二目标内容的概率,根据所述概率和所述第一置信度进行模型训练,输出所述待识别信息的第二置信度,包括:利用大数据分析技术获取垃圾信息中包含预设所述第二目标内容的概率,所述第二目标内容包含非法关键词、非法网络链接、非法第三方平台账号;将所述第一置信度和所述概率输入神经网络模型进行训练,获取所述待识别信息的第二置信度,所述待识别信息的第二置信度包含所述待识别信息是否为垃圾信息的置信度。4.根据权利要求3所述的一种基于大数据与神经网络的信息智能拦截方法,其特征在于,获取发送所述待识别信息的通讯方式的过往信用记录,基于所述第二置信度和所述过往信用记录判断是否对所述待识别信息进行拦截,包括:根据大数据监测技术对发送所述待识别信息的通讯方式进行监测,获取所述通讯方式的过往信用记录,所述过往信用记录包含过去发送垃圾信息的次数及其信用度;根据预先设置的置信度阈值、发送垃圾信息的次数阈值及信用度等级,与所述第二置信度、所述发送垃圾信息的次数及其信用度进行比较,判断是否对所述待识别信息进行拦截;当所述待识别信息的第二置信度大于等于设置的置信度阈值、发送垃圾信息的次数小于设置的发送次数阈值且信用度等级小于设置等级时,或当所述待识别信息的第二置信度大于阈值且发送垃圾信息的次数大于设置阈值时,就对所述待识别信息进行拦截处理。5.一种基于大数据与神经网络的信息智能拦截装置,其特征在于,包括:词向量处理模块,用于获取待识别信息中第一目标内容的第一词向量,将所述第一词向量输入神经网络模型进行训练,输出所述第一目标内容的第一置信度;第二置信度获取模...

【专利技术属性】
技术研发人员:骆利华徐锐
申请(专利权)人:杭州宽信科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1