一种融合传播关系的诈骗信息的检测方法技术

技术编号:37587747 阅读:10 留言:0更新日期:2023-05-18 11:04
本发明专利技术公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明专利技术解决了对大量诈骗信息进行检测时,处理效率低的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
一种融合传播关系的诈骗信息的检测方法


[0001]本专利技术涉及计算机领域,具体而言,涉及一种融合传播关系的诈骗信息的检测方法。

技术介绍

[0002]近年来,伴随着信息技术的蓬勃发展,互联网的布设与使用正在大范围的迅速普及,大量不同领域、不同地域、不同时域的信息在产生后便立即经由互联网广泛传播。与此同时,移动互联网与电信网络的深层次发展以及移动手持通讯设备的大量普及更是令这种现象愈专利技术显。但网络上的信息产生并不经任何审核,因此信息的真实性并无法保证,大量包含夸张、不实甚至捏造的信息与真实的信息混杂在一起,往往使得人们难以分辨,短时间内产生的虚假信息数量更是数以亿计,传统的信息处理技术与分析手段都无法适应这种数据量级数据的处理与运算。

技术实现思路

[0003]本专利技术实施例提供了一种融合传播关系的诈骗信息的检测方法,以至少解决对大量诈骗信息进行检测时,处理效率低的技术问题。
[0004]根据本专利技术实施例的一个方面,提供了一种融合传播关系的诈骗信息的检测方法,包括:获取第一信息组、诈骗账号库以及正常账号库,其中上述第一信息组中的每一个信息包括文本信息和发信账号;根据上述诈骗账号库和上述正常账号库从上述第一信息组中确定第二信息组,其中上述第二信息组中的每一个信息的发信账号在上述诈骗账号库和上述正常账号库中都不存在;根据上述第二信息组得到多个目标信息组,其中每一个上述目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个上述目标信息组的诈骗权重值;在上述目标信息组的上述诈骗权重值大于第二阈值的情况下,将上述目标信息组中的每一个文本信息确定为诈骗信息。
[0005]在本专利技术实施例中,采用了获取第一信息组、诈骗账号库以及正常账号库,其中上述第一信息组中的每一个信息包括文本信息和发信账号;根据上述诈骗账号库和上述正常账号库从上述第一信息组中确定第二信息组,其中上述第二信息组中的每一个信息的发信账号在上述诈骗账号库和上述正常账号库中都不存在;根据上述第二信息组得到多个目标信息组,其中每一个上述目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个上述目标信息组的诈骗权重值;在上述目标信息组的上述诈骗权重值大于第二阈值的情况下,将上述目标信息组中的每一个文本信息确定为诈骗信息的方法,由于在上述方法中,第一步根据诈骗账号库和正常账号库进行筛选,第二步根据相似文本信息数量进行合并得到多个目标信息组,第三步计算每个目标信息组的诈骗权重值,最后将诈骗权重值大于第二阈值的目标信息组中的所有文本信息确定为诈骗信息,从而实现了提高检测诈骗信息的处理效率的目的,进而解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
附图说明
[0006]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0007]图1是根据本专利技术实施例的一种可选的融合传播关系的诈骗信息的检测方法的流程图;
[0008]图2是根据本专利技术实施例的一种可选的融合传播关系的诈骗信息的检测方法的整体流程图;
[0009]图3是根据本专利技术实施例的一种可选的融合传播关系的诈骗信息的检测方法的传播网络图。
具体实施方式
[0010]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0011]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0012]根据本专利技术实施例的第一方面,提供了一种融合传播关系的诈骗信息的检测方法,可选地,如图1所示,上述方法包括:
[0013]S102,获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;
[0014]S104,根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;
[0015]S106,根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;
[0016]S108,计算每一个目标信息组的诈骗权重值;
[0017]S110,在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。
[0018]可选地,本实施例中,第一信息组为要检测的所有信息,每个信息包括文本信息和发信账号。诈骗账号库为保存的所有确定的诈骗账号,诈骗账号库为保存的所有确定的诈骗账号,正账号库为保存的所有确定的正常账号。
[0019]可选地,本实施例中,先将第一信息组进行筛选,筛选出发信账号既不在正常账号库中也不在诈骗账号库的的第二信息组,将发信账号在诈骗账号库的信息的文本信息确定
诈骗信息,将发信账号在正常账号库的信息的文本信息确定正常信息。将第二信息组根据相似文本数量进行合并,例如第一目标信息组中包括发信账号1和发信账号2,发信账号中的10条文本信息与发信账号2中的10条文本信息的文本相似度超过0.8,其中,10大于第一阈值,以此类推,得到多个目标信息组,最后计算每一个目标信息组的诈骗权重值,将诈骗权重值大于第二阈值的目标信息组中的所有文本信息确定为诈骗信息。
[0020]可选地,本实施例中,第一步根据诈骗账号库和正常账号库进行筛选,第二步根据相似文本信息数量进行合并得到多个目标信息组,第三步计算每个目标信息组的诈骗权重值,最后将诈骗权重值大于第二阈值的目标信息组中的所有文本信息确定为诈骗信息,从而实现了提高检测诈骗信息的处理效率的目的,进而解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
[0021]作为一种可选的示例,在根据第二信息组得到多个目标信息组之前,上述方法还包括:
[0022]计算第一文本信息与第二文本信息的文本相似度,其中第一文本信息为第二信息组中的文本信息,第二文本信息为第二信息组中除第一文本信息外的文本信息,第一文本信息与第二文本信息为不同发信账号的文本信息;
[0023]在文本相似度大于第三阈值的情况下,确定第一文本信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合传播关系的诈骗信息的检测方法,其特征在于,包括:获取第一信息组、诈骗账号库以及正常账号库,其中所述第一信息组中的每一个信息包括文本信息和发信账号;根据所述诈骗账号库和所述正常账号库从所述第一信息组中确定第二信息组,其中所述第二信息组中的每一个信息的发信账号在所述诈骗账号库和所述正常账号库中都不存在;根据所述第二信息组得到多个目标信息组,其中每一个所述目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个所述目标信息组的诈骗权重值;在所述目标信息组的所述诈骗权重值大于第二阈值的情况下,将所述目标信息组中的每一个文本信息确定为诈骗信息。2.根据权利要求1所述的方法,其特征在于,在根据所述第二信息组得到多个目标信息组之前,所述方法还包括:计算第一文本信息与第二文本信息的文本相似度,其中所述第一文本信息为所述第二信息组中的文本信息,所述第二文本信息为所述第二信息组中除所述第一文本信息外的文本信息,所述第一文本信息与所述第二文本信息为不同发信账号的文本信息;在所述文本相似度大于第三阈值的情况下,确定所述第一文本信息与所述第二文本信息为所述相似文本信息。3.根据权利要求2所述的方法,其特征在于,所述计算第一文本信息与第二文本信息的文本相似度包括:根据所述第一文本信息和所述第二文本信息中的网页地址确定第一相似值;根据所述第一文本信息和所述第二文本信息中的账号确定第二相似值;根据所述第一文本信息和所述第二文本信息的语义确定第三相似值;将所述第一相似...

【专利技术属性】
技术研发人员:马宏远王磊王丽宏时磊贺敏贾云刚孙捷段运强鲁睿段荣昌王子涵任博雅井雅琪党中恺彭鑫
申请(专利权)人:北京中科闻歌科技股份有限公司国家计算机网络与信息安全管理中心天津分中心
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1