一种利用键值匹配模型提高黑名单准确率的方法及系统技术方案

技术编号:26342483 阅读:36 留言:0更新日期:2020-11-13 20:34
本发明专利技术公开了一种利用键值匹配模型提高黑名单准确率的方法,包括:S1.采集类别标签中的每个号码数据对应的24小时内的通话记录;S2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;S3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;S4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;S5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据得到的键值对计算查询键所对应的类别标签,得到最终结果。

A method and system to improve the accuracy of blacklist by using key value matching model

【技术实现步骤摘要】
一种利用键值匹配模型提高黑名单准确率的方法及系统
本专利技术涉及通信安全以及数据挖掘
,尤其涉及一种利用键值匹配模型提高黑名单准确率的方法及系统。
技术介绍
随着通信行业的成熟和发展,移动通信资费逐渐降低,群众和企业从中切实受益,但低成本的通信费用也为恶意营销类骚扰电话提供了滋生的土壤。一些不法分子出于恶意报复、勒索等目的,利用移动通信进行骚扰等违法犯罪活动。另外市场形成饱和格局,企业之间为实现产品销售的竞争激化,也使得未经过用户允许的营销类骚扰电话的传播。AI发展衍生出了电销机器人,减低了营销成本,更加剧了这一产业的发展。商业营销类电话、恶意骚扰等电话泛滥,给移动用户带来了巨大的经济损失和生活困扰,同时蚕食着电信营运商的宝贵网络资源。随着云计算、大数据的不断发展,海量数据计算能力不断增强,核心算法不断突破,应用邻域不断扩展,已成为技术创新的重要技术,在骚扰电话治理工作中发挥的作用也越专利技术显,识别准确度更高、覆盖完整性更全、监控实时性更快,在骚扰电话治理工作中已经成为重要生产力,高效识别骚扰电话可有效减少骚扰电话蔓延带来的负面本文档来自技高网...

【技术保护点】
1.一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,包括步骤:/nS1.采集类别标签中的每个号码数据对应的24小时内的通话记录;/nS2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;/nS3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;/nS4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将所述查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;/nS5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据...

【技术特征摘要】
1.一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,包括步骤:
S1.采集类别标签中的每个号码数据对应的24小时内的通话记录;
S2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;
S3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;
S4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将所述查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;
S5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据得到的键值对计算查询键所对应的类别标签,得到最终结果。


2.根据权利要求1所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,所述步骤S1中的类别标签的号码包括黑名单号码、白名单号码、未定义号码、正常号码。


3.根据权利要求2所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,所述步骤S2包括:
S21.统计当前号码24小时内通话记录的次数;
S22.判断统计的当前号码24小时中每个时间点的通话次数是否大于第一预设阈值,若是,则将大于第一预设阈值所对应的时间点的数值转换为1;若否,则将小于等于第一预设阈值所对应的时间点的数值转换为0,并记录当前号码转换后的数据特征;
S23.获取记录的当前号码的数据特征中为1的时间点,并将获取的为1的时间点对应的数值转换为字符,将转换后的字符进行拼接,得到当前号码的查询键;
S24.将得到的当前号码的查询键与当前号码对应的类别标签进行组合,生成当前号码的数据集。


4.根据权利要求1所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,所述步骤S5中根据得到的键值对计算查询键所对应的类别标签具体为:
计算键值对中每个数值的结果,并将计算得到的每个数值的结果与第二预设阈值进行比较,得到大于第二预设阈值的数值,并根据得到的大于第二预设阈值的数值得到数值对应的类别标签。


5.根据权利要求4所述的一种利用键值匹配模型提高黑名单准确率的方法,其特征在于,所述计算键值对中每个数值的结果,表示为:



其中,y表示计算后得到各标签的概率值;yi表示键值对中第i个数值;Y表示所有标签个数累加后的yi的集合。


6.一种利用键值匹配模型提高黑...

【专利技术属性】
技术研发人员:陈晓莉丁一帆徐菁徐佳丽杨世宏徐云华林建洪
申请(专利权)人:浙江鹏信信息科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1