【技术实现步骤摘要】
骚扰电话识别方法及其装置
本专利技术涉及通信大数据领域,尤其涉及一种骚扰电话识别方法、装置、计算机设备和计算机可读存储介质。
技术介绍
“骚扰电话”是指推销产品或者是一些冒充警方、银行工作人员进行诈骗以及故意电话骚扰的行为。按骚扰目的可分为商业营销类、恶意骚扰类和违法犯罪类。识别骚扰电话在社会生活中具有广泛的应用。当前,营销电话扰民、恶意电话骚扰等问题日益突出,严重影响人民群众正常生活。更严重的,有些冒充公检法机关进行电话诈骗,造成人民的巨大财产损失。骚扰电话识别目前主要采用如下两种方案来解决:骚扰词典方案:这种方案人工收集关键词。若任一可疑号码所在的目标通话记录包含的关键词中存在预设词典记录的骚扰特征词,则将所在的目标通话记录中存在骚扰特征词的可疑号码判定为骚扰电话号码。规则识别方案:这种方案人工分析骚扰电话的特点,总结出一套用于识别的规则,对号码进行识别。上述两种方案使用场景有所不同,所带来的问题和不足也有所不同:骚扰词典方案实现起来比较简单,骚扰词典由人工制定,关键词的覆盖度不高,这样直 ...
【技术保护点】
1.一种骚扰电话识别方法,其特征在于,包括:/n用户将接收到的骚扰电话号码标记为骚扰电话;/n提取所述标记的骚扰电话的特征,建立分类模型,并且使用所述分类模型判定待识别的主叫号码是否是骚扰电话;/n在所述用户标记与所述分类模型同时判定所述待识别的主叫号码是骚扰电话时,则所述主叫号码被判定为骚扰电话号码;在所述用户标记或者所述分类模型判定所述待识别的主叫号码为骚扰电话时,则所述主叫号码被判定为疑似骚扰电话号码;在所述用户标记和所述分类模型均判定所述待识别的主叫号码为正常电话号码时,则所述主叫号码被判定为正常电话号码;/n将所述骚扰电话号码、疑似骚扰电话号码、正常电话号码以及对 ...
【技术特征摘要】
1.一种骚扰电话识别方法,其特征在于,包括:
用户将接收到的骚扰电话号码标记为骚扰电话;
提取所述标记的骚扰电话的特征,建立分类模型,并且使用所述分类模型判定待识别的主叫号码是否是骚扰电话;
在所述用户标记与所述分类模型同时判定所述待识别的主叫号码是骚扰电话时,则所述主叫号码被判定为骚扰电话号码;在所述用户标记或者所述分类模型判定所述待识别的主叫号码为骚扰电话时,则所述主叫号码被判定为疑似骚扰电话号码;在所述用户标记和所述分类模型均判定所述待识别的主叫号码为正常电话号码时,则所述主叫号码被判定为正常电话号码;
将所述骚扰电话号码、疑似骚扰电话号码、正常电话号码以及对应的号码类别存储在数据库中。
2.根据权利要求1所述的骚扰电话识别方法,其中用户将接收到的骚扰电话号码标记为骚扰电话包括:
用户根据通话内容、通话意图、来电显示号码、或者主叫方语音语调将接收到的骚扰电话号码标记为骚扰电话。
3.根据权利要求2所述的骚扰电话识别方法,其中提取所述标记的骚扰电话的特征,建立分类模型包括:
提取置信度较高的所述标记的骚扰电话的特征,建立分类模型。
4.根据权利要求3所述的骚扰电话识别方法,其中所述标记的骚扰电话的特征包括属性特征和行为特征,所述属性特征包括号码类型、号码归属地、号码运营商;所述行为特征包括平均拨出未接响铃时间、拨出接通比、拨出拒接比例、呼入拨出比、呼入拨出时间比、平均接通时间。
5.根据权利要求4中所述的骚扰电话识别方法,其中将所述骚扰电话号码、疑似骚扰电话号码、正常电话号码以及对应的号码类别存储在数据库中包括:
以所述骚扰电话号码、疑似骚扰电话号码、正常电话号码为密钥值k,对应的号码类别为数值v,将所述密钥值k和所述数值v写入k-v数据库。
6.根据权利要求1-5中任一项所述的骚扰电话识别方法,其中所述分类模型包括随机森林模型。
7.一种骚扰电话识别装置,其特征在于,包括:
标记单元,配置为使得用户能够将接收到的骚扰电话号码标记为骚扰电话;
构建单元,用于提取所述标记的...
【专利技术属性】
技术研发人员:陈程,杨敬,彭继东,杨旭虹,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。