异常短信的检测方法、装置、计算机设备及介质制造方法及图纸

技术编号:31703477 阅读:14 留言:0更新日期:2022-01-01 11:05
本发明专利技术实施例公开了一种异常短信的检测方法、装置、计算机设备及介质。该方法包括:获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量;将所述文本特征向量输入至异常短信分类模型中,获取与目标短信文本匹配的分类结果;如果确定分类结果为目标异常类别的异常短信,则使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测;如果确定再检测结果与分类结果相一致,则确定目标短信文本为所述目标异常类别的异常短信,并识别所述目标短信文本中包括的至少一个关键实体。本发明专利技术实施例的技术方案能够提高异常短信的检测准确性。异常短信的检测准确性。异常短信的检测准确性。

【技术实现步骤摘要】
异常短信的检测方法、装置、计算机设备及介质


[0001]本专利技术实施例涉及人工智能技术,尤其涉及一种异常短信的检测方法、装置、计算机设备及介质。

技术介绍

[0002]目前,短信作为大型信息交流平台,为信息的传递提供了便利。然而部分不法分子利用这一平台传递不良信息,对社会治安管理、人民日常生活等方面造成了许多不良影响。
[0003]然而,现有的各种异常短信的识别技术,在异常短信的检测准确性上均存在一定的缺陷,往往会造成正常短信的误识别,因此,有待提出一种异常短信检测的新方式,以满足用户的异常短信的检测需求。

技术实现思路

[0004]本专利技术实施例提供了一种异常短信的检测方法、装置、计算机设备及介质,以提高异常短信的检测准确性。
[0005]第一方面,本专利技术实施例提供了一种异常短信的检测方法,该方法包括:
[0006]获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量;
[0007]将所述文本特征向量输入至异常短信分类模型中,获取与目标短信文本匹配的分类结果,异常短信分类模型中包括:多个类型的异常短信分类子模型,以及与各异常短信分类子模型分别相连的融合处理子模型;
[0008]如果确定分类结果为目标异常类别的异常短信,则使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测;
[0009]如果确定再检测结果与分类结果相一致,则确定目标短信文本为所述目标异常类别的异常短信,并识别所述目标短信文本中包括的至少一个关键实体。<br/>[0010]第二方面,本专利技术实施例还提供了一种异常短信的检测装置,该装置包括:
[0011]文本特征向量形成模块,用于获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量;
[0012]分类结果获取模块,用于将所述文本特征向量输入至异常短信分类模型中,获取与目标短信文本匹配的分类结果,异常短信分类模型中包括:多个类型的异常短信分类子模型,以及与各异常短信分类子模型分别相连的融合处理子模型;
[0013]短信文本检测模块,用于如果确定分类结果为目标异常类别的异常短信,则使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测;
[0014]实体识别模块,用于如果确定再检测结果与分类结果相一致,则确定目标短信文本为所述目标异常类别的异常短信,并识别所述目标短信文本中包括的至少一个关键实体。
[0015]第三方面,本专利技术实施例还提供了一种计算机设备,该计算机设备包括:
[0016]一个或多个处理器;
[0017]存储装置,用于存储一个或多个程序;
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例任一所述的异常短信的检测方法。
[0019]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如本专利技术实施例任一所述的异常短信的检测方法。
[0020]本专利技术通过获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量;将所述文本特征向量输入至异常短信分类模型中,获取与目标短信文本匹配的分类结果;如果确定分类结果为目标异常类别的异常短信,则使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测;如果确定再检测结果与分类结果相一致,则确定目标短信文本为所述目标异常类别的异常短信,并识别所述目标短信文本中包括的至少一个关键实体。本专利技术实施例的技术方案在使用一个普适化的模型获取异常短信文本的异常类别后,进一步使用与该异常类别匹配的单分类检测模型对该异常短信文本进行再检测,可以有效提供检测结果的准确性,同时,通过在异常短信文本中提取出关键实体的方式,可以将异常短信文本中包括的关键实体与异常分类进行组合存储,为后续分析异常文本提供了更新丰富的信息量。
附图说明
[0021]图1是本专利技术实施例一中的一种异常短信的检测方法的流程图;
[0022]图2是本专利技术实施例二中的另一种异常短信的检测方法的流程图;
[0023]图3是本专利技术实施例三中的另一种异常短信的检测方法的流程图;
[0024]图4是本专利技术实施例四中的一种异常短信的检测装置的结构示意图;
[0025]图5是本专利技术实施例五中的一种计算机设备的结构示意图。
具体实施方式
[0026]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0027]实施例一
[0028]图1为本专利技术实施例一提供的一种异常短信的检测方法的流程图,本实施例可适用于在大量短信文本中检测出异常短信,并确定异常短信的异常类型和关键实体的情况,该方法可以由异常短信的检测装置来执行,该装置可以通过软件和/或硬件的方式实现,并一般可以集成在具有数据处理功能的终端设备或者服务器中。具体的,参考图1,该方法具体包括如下步骤:
[0029]S110、获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量。
[0030]其中,目标短信文本可以是从运营商处获取的全部原始短信文本中的一个,也可以是对全部原始短信文本进行筛选后得到的部分疑似异常短信文本中的一个。文本特征向量可以是能够被计算机模型识别的计算机语言,例如,用二进制数0和1组成的一串编码。
[0031]典型的,可以通过one

hot编码、TF

IDF算法或者Word2vec算法,形成与目标短信文本匹配的文本特征向量。在本专利技术的一个可选实施例中,获取待检测的目标短信文本,可
以包括:获取原始短信文本,并通过至少一种正常短信检测规则,判断所述原始短信文本是否为正常短信;若否,则通过至少一种异常短信检测规则,判断所述原始短信文本是否为疑似异常短信;若是,则将所述原始短信文本,确定为所述目标短信文本。
[0032]其中,原始短信文本可以是最初始的未经任何规则处理筛选的短信文本。当确定一个原始短信文本为正常短信后,可以直接对该原始短信文本进行过滤处理,无需进行后续的判断,以节约计算资源。
[0033]其中,正常短信检测规则可以是预先设定的能够从原始短信文本中检测筛选出正常短信文本的规则。正常短信检测规则可以是设置字长限定条件和设置发信人白名单等。可以通过设置字长限定条件(例如,三个字符或者五个字符等),将大部分寥寥几个字的原始短信文本作为正常短信检出,例如,短信文本内容为“好的”或者“收到”等短文本。或者,还可以通过设置发信人白名单,将运营商、正规机构所发送的短信作为正常短信检测,例如,以中国移动“10086”和工商银行“95588”为发信人的短信。
[0034]异常短信检测规则可以是预先设定的能够从原始短信文本中检测筛选出异常短信文本的规则。异常短信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常短信的检测方法,其特征在于,包括:获取待检测的目标短信文本,并形成与目标短信文本匹配的文本特征向量;将所述文本特征向量输入至异常短信分类模型中,获取与目标短信文本匹配的分类结果,异常短信分类模型中包括:多个类型的异常短信分类子模型,以及与各异常短信分类子模型分别相连的融合处理子模型;如果确定分类结果为目标异常类别的异常短信,则使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测;如果确定再检测结果与分类结果相一致,则确定目标短信文本为所述目标异常类别的异常短信,并识别所述目标短信文本中包括的至少一个关键实体。2.根据权利要求1所述的方法,其特征在于,获取待检测的目标短信文本,包括:获取原始短信文本,并通过至少一种正常短信检测规则,判断所述原始短信文本是否为正常短信;若否,则通过至少一种异常短信检测规则,判断所述原始短信文本是否为疑似异常短信;若是,则将所述原始短信文本,确定为所述目标短信文本。3.根据权利要求1所述的方法,其特征在于,所述异常短信分类子模型具体包括:第一逻辑回归分类模型、第二逻辑回归分类模型以及快速文本分类模型;第一逻辑回归分类模型,用于形成与所述文本特征向量匹配的字粒度加权指数,并根据所述字粒度加权指数,形成与目标短信文本匹配的第一分类结果;第二逻辑回归分类模型,用于形成与所述文本特征向量匹配的词粒度加权指数,并根据所述词粒度加权指数,形成与目标短信文本匹配的第二分类结果;快速文本分类模型,用于根据所述文本特征向量,形成与目标短信文本匹配的第三分类结果;所述融合处理子模型,用于根据第一逻辑回归分类模型、第二逻辑回归分类模型以及快速文本分类模型的参考权重,对第一分类结果、第二分类结果和第三分类结果进行融合处理,得到所述与目标短信文本匹配的分类结果。4.根据权利要求1所述的方法,其特征在于,使用与目标异常类别匹配的目标单分类检测模型对目标短信文本进行再检测,包括:将所述目标短信文本、与所述目标短信文本匹配的文本特征向量以及与目标异常类别匹配的分类标签输入至所述目标单分类检测模型中,获取所述目标短信文本是否属于所述目标异常类别的判定结果;如果确定所述判定结果为属于,则获取与所述目标异常类别匹配的至少一条研判规则,对所述目标短信文本进行再次判断;如果确定所述目标短信文本与各所述研判规则均匹配,则确定再检测结果与分类结果相一致。5.根据权利要求1所述的方法,其特征在于,在获取待检测的目标短信文本之后,还包括:获取与所...

【专利技术属性】
技术研发人员:张录录李雪峰尚程傅强蔡琳梁彧田野王杰杨满智金红陈晓光
申请(专利权)人:恒安嘉新北京科技股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1