一种负面标记号码识别方法、设备及计算机存储介质技术

技术编号:22688890 阅读:31 留言:0更新日期:2019-11-30 03:33
本发明专利技术公开了一种负面标记号码识别方法、设备及计算机存储介质,包括:获取查询号码;根据查询号码获得所述查询号码在至少两个不同设定周期内的通信指标信息;利用号码识别模型,根据所述查询号码在至少两个不同设定周期内的通信指标信息对所述查询号码进行识别,得到所述查询号码为负面标记号码或非负面标记号码的号码识别结果,应用本发明专利技术实施例用于对负面标记号码进行识别。

An identification method, equipment and computer storage medium of negative tag number

The invention discloses a negative mark number identification method, equipment and computer storage medium, including: obtaining a query number; obtaining the communication index information of the query number in at least two different set cycles according to the query number; using the number identification model, the query number is compared with the communication index information of the query number in at least two different set cycles according to the communication index information of the query number in at least two different set cycles The code is used for identification, and the number identification result of the inquiry number being a negative mark number or a non negative mark number is obtained. The embodiment of the invention is used for identification of the negative mark number.

【技术实现步骤摘要】
一种负面标记号码识别方法、设备及计算机存储介质
本专利技术涉及机器学习
,尤其涉及一种负面标记号码识别方法、设备及计算机存储介质。
技术介绍
随着社会的不断进步,手机等移动终端成为了人手必备的电子产品,通常人们通过收放短信或打电话实现信息的交互。随着电子产品的普及,用户需要经常面临与未保存在通讯录中的陌生号码的通讯会话,但是由于不能快速识别陌生号码的身份,用户常常会面临遭到诈骗或骚扰的风险,而合法通讯的会话也因为号码的未知导致用户之间不能轻易信任对方,影响双方沟通效率。各种类型骚扰电话同样给人们的生活、工作带来不利影响。因此如何准确地识别电话号码的类型成为亟待解决的问题。
技术实现思路
本专利技术提供一种负面标记号码识别方法、设备及计算机存储介质,用于对负面标记号码进行识别。本专利技术一方面提供一种负面标记号码识别方法,包括:获取查询号码;根据查询号码获得所述查询号码在至少两个不同设定周期内的通信指标信息;利用号码识别模型,根据所述查询号码在至少两个不同设定周期内的通信指标信息对所述查询号码进行识别,得到所述查询号码为负面标记号码或非负面标记号码的号码识别结果。在一种可实施方式中,根据查询号码获取所述查询号码在至少两个不同设定周期内的通信指标信息,包括:针对所述至少两个设定周期内的每一个设定周期,分别查询所述查询号码在设定周期内的通话行为信息和短信行为信息;分别对所述设定周期内的通话行为信息和短信行为信息进行统计,获得所述查询号码在设定周期内的通话特征和短信特征;汇总所述设定周期内的通话特征和所述短信特征,获得通信指标信息。在一种可实施方式中,所述通话特征包括如下特征至少之一:用于评价所述设定周期内号码相关总通话频次的第一通话特征,用于评价呼入通话频次的第二通话特征,用于评价呼出通话频次的第三通话特征,用于评价呼入通话时间的第四通话特征,用于评价呼出通话时间的第五通话特征,用于评价呼出通话空号比例的第六通话特征,用于评价通讯录通话比例的第七通话特征,用于评价单位时间内电话号码的熵的第八通话特征;用于评价通信电话频次波动的第九通话特征;所述短信特征包括如下特征至少之一:用于评价所述设定周期内号码相关总短信频次的第一短信特征,用于评价所述设定周期内收信频次特征的第二短信特征,用于评价所述设定周期内发信频次特征的第三短信特征;用于评价发出信息空号比例的第四短信特征,用于评价通讯录收发信息比例的第五短信特征。在一种可实施方式中,所述方法还包括:基于特征重要性评价策略,对不同的所述通话特征和所述短信特征联合不同权值;将联合不同权值的通话特征和短信特征汇总,获得所述通信指标信息。在一种可实施方式中,所述方法还包括:借助黑白名单获取多个号码样本;根据所述多个号码样本分别获得对应所述至少两个设定周期内每一个设定周期的通信行为信息样本;对所述每一个设定周期的通信行为信息样本进行统计,获得对应的通信指标信息样本;通过所得到的所有设定周期的通信指标信息样本进行模型训练,获得所述号码识别模型。本专利技术另一方面提供一种负面标记号码识别设备,包括:获取模块,用于获取查询号码;获得模块,用于根据查询号码获得所述查询号码在至少两个不同设定周期内的通信指标信息;识别模块,用于利用号码识别模型,根据所述查询号码在至少两个不同设定周期内的通信指标信息对所述查询号码进行识别,得到所述查询号码为负面标记号码或非负面标记号码的号码识别结果。在一种可实施方式中,所述获得模块,包括:查询子模块,用于针对所述至少两个设定周期内的每一个设定周期,分别查询所述查询号码在设定周期内的通话行为信息和短信行为信息;统计子模块,用于分别对所述设定周期内的通话行为信息和短信行为信息进行统计,获得所述查询号码在设定周期内的通话特征和短信特征;汇总子模块,用于汇总所述设定周期内的通话特征和所述短信特征,获得通信指标信息。在一种可实施方式中,所述设备还包括:联合模块,用于基于特征重要性评价策略,对不同的所述通话特征和所述短信特征联合不同权值;汇总模块,用于将联合不同权值的通话特征和短信特征汇总,获得所述通信指标信息。在一种可实施方式中,所述设备还包括:样本获取模块,用于借助黑白名单获取多个号码样本;样本获得模块,用于根据所述多个号码样本分别获得对应所述至少两个设定周期内每一个设定周期的通信行为信息样本;样本统计模块,用于对所述每一个设定周期的通信行为信息样本进行统计,获得对应的通信指标信息样本;模型训练模块,用于通过所得到的所有设定周期的通信指标信息样本进行模型训练,获得所述号码识别模型。本专利技术另一方面提供一种计算机存储介质,所述存储介质中存储有计算机可执行指令,当所述指令被执行时用于执行上述可实施方式中任一项所述负面标记号码识别方法。本专利技术实提供的一种负面标记号码识别方法、设备及计算机存储介质,用于对查询号码在不同设定周期内的通信指标信息进行识别,识别查询号码是否属于负面标记号码。附图说明图1示出了本专利技术实施例号码识别方法的流程示意图;图2示出了本专利技术实施例方法中获取通信指标信息的流程示意图;图3示出了本专利技术实施例方法中汇总特征的流程示意图;图4示出了本专利技术实施例方法中训练模型的流程示意图;图5示出了本专利技术实施例号码识别设备的模块示意图。具体实施方式为使本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1示出了本专利技术实施例号码识别方法的流程示意图。参见图1,本专利技术实施例一方面提供一种负面标记号码识别方法,包括:步骤101,获取查询号码;步骤102,根据查询号码获得查询号码在至少两个不同设定周期内的通信指标信息;步骤103,利用号码识别模型,根据查询号码在至少两个不同设定周期内的通信指标信息对查询号码进行识别,得到查询号码为负面标记号码或非负面标记号码的号码识别结果。本专利技术实施例提供的一种负面标记号码识别方法用于对查询号码在不同设定周期内的通信指标信息进行识别,识别查询号码是否属于负面标记号码。该方法可应用于具有数据处理功能的设备,也可应用于具有数据处理功能的服务器。具体的,该方法首先获得查询号码,该查询号码包括手机号、座机号以及其他任意具有通信身份标识的号码的任一种或多种。根据该号码识别方法所应用的设备,查询号码的获得方式同样可以为多种,如由设备通过数据库抓取获得查询号码,也可以由设备感应输入内容获得查询号码,还可以由其他设备通过通信传输,使应用该方法的设备接收查询号码。在设备获得查询号码后,根据查询号码获得查询号码在至少两个不同设定周期内的通信指标信息。通信指标信息至少通过对应该查询号码的通话行为信息和短信行为信息获得。其中,通话行为信息和短信本文档来自技高网...

【技术保护点】
1.一种负面标记号码识别方法,其特征在于,包括:/n获取查询号码;/n根据查询号码获得所述查询号码在至少两个不同设定周期内的通信指标信息;/n利用号码识别模型,根据所述查询号码在至少两个不同设定周期内的通信指标信息对所述查询号码进行识别,得到所述查询号码为负面标记号码或非负面标记号码的号码识别结果。/n

【技术特征摘要】
1.一种负面标记号码识别方法,其特征在于,包括:
获取查询号码;
根据查询号码获得所述查询号码在至少两个不同设定周期内的通信指标信息;
利用号码识别模型,根据所述查询号码在至少两个不同设定周期内的通信指标信息对所述查询号码进行识别,得到所述查询号码为负面标记号码或非负面标记号码的号码识别结果。


2.根据权利要求1所述的方法,其特征在于,根据查询号码获取所述查询号码在至少两个不同设定周期内的通信指标信息,包括:
针对所述至少两个设定周期内的每一个设定周期,分别查询所述查询号码在设定周期内的通话行为信息和短信行为信息;
分别对所述设定周期内的通话行为信息和短信行为信息进行统计,获得所述查询号码在设定周期内的通话特征和短信特征;
汇总所述设定周期内的通话特征和所述短信特征,获得通信指标信息。


3.根据权利要求1所述的方法,其特征在于,
所述通话特征包括如下特征至少之一:用于评价所述设定周期内号码相关总通话频次的第一通话特征,用于评价呼入通话频次的第二通话特征,用于评价呼出通话频次的第三通话特征,用于评价呼入通话时间的第四通话特征,用于评价呼出通话时间的第五通话特征,用于评价呼出通话空号比例的第六通话特征,用于评价通讯录通话比例的第七通话特征,用于评价单位时间内电话号码的熵的第八通话特征;用于评价通信电话频次波动的第九通话特征;
所述短信特征包括如下特征至少之一:用于评价所述设定周期内号码相关总短信频次的第一短信特征,用于评价所述设定周期内收信频次特征的第二短信特征,用于评价所述设定周期内发信频次特征的第三短信特征;用于评价发出信息空号比例的第四短信特征,用于评价通讯录收发信息比例的第五短信特征。


4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于特征重要性评价策略,对不同的所述通话特征和所述短信特征联合不同权值;
将联合不同权值的通话特征和短信特征汇总,获得所述通信指标信息。


5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
借助黑白名单获取多个号码样本;
根据所述多个号码样本分别获得对应所述至少两个设定...

【专利技术属性】
技术研发人员:陈益梦
申请(专利权)人:北京泰迪熊移动科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1