基于深层类神经网络的骚扰电话识别方法和装置制造方法及图纸

技术编号:17661296 阅读:34 留言:0更新日期:2018-04-08 12:33
本发明专利技术公开了一种基于深层类神经网络的骚扰电话识别方法和装置,其中方法包括:收集陌生来电记录建立训练集;提取所述训练集中每条陌生来电记录的行为信息值生成多维向量;构建深层类神经网络,使用所述训练集中的陌生来电记录训练所述深层类神经网络;采集陌生来电号码的行为信息生成多维向量输入到训练好的所述深层类神经网络中,根据所述深层类神经网络的输出层得到的特征值判断所述陌生来电号码是否为骚扰电话。由此,不再需要耗费资源借由人工来提取骚扰电话的特征码,有效解決骚扰电话识别问题。

【技术实现步骤摘要】
基于深层类神经网络的骚扰电话识别方法和装置
本申请专利技术实例涉及计算器领域的机器学习与数据挖掘方法,其中特别涉及一种基于深层类神经网络的骚扰电话识别方法和装置。
技术介绍
机器学习分类算法可以用来预测类别或类别数据的单一实例,其中二元分类其目标是要预测两个结果之一,例如:电子邮件筛选器会使用二元分类来判断电子邮件是否为垃圾邮件;另一个是多级分类,其目标是要预测许多结果之一;而分类算法的输出称为分类器,可用来预测新(未加上卷标)实例的卷标。而机器学习技术近年来的进步,促使应用层面相当广泛,例如推荐引擎、定向广告、医学诊断、自然语言处理、搜索引擎、诈骗侦测、证券分析、视觉辨识、语音识别及手写识别等等。伴随着智能手机的普及,骚扰电话、诈骗电话增速明显,正在逐步取代电脑病毒、钓鱼网站成为移动互联网时代用户信息安全的新威胁。在全球很多国家和地区,通过电信进行诈骗的悲剧不断曝光,骚扰电话、诈骗电话的危害已经从财产安全扩展到人身安全。目前相关技术多为直接搜集相关可疑来电号码建制黑白名单进来拦截,但由于来电号码伪造技术的进步,此方法明显无法实时的拦截及封阻;另外亦有藉由传统机器学习的逻辑回归、判定树、随机森林等演算方法进行学习,希望藉此能做到较为实时的封阻,但这只适用于少数国家的特定应用场景,应对全球各个国家和地区骚扰电话越来越多的情况明显较不足。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种深层类神经网络的骚扰电话识别方法,该方法主要是透过深层类神经网络技术,通过挖掘陌生来电记录的行为信息生成多维数据特征向量,然后输入到深层类神经网络,借由反向传播算法进行反复训练提升深层类神经网络对骚扰电话的识别率,继而可以使用训练好的深层类神经网络模型检测和识别陌生来电是否为骚扰电话。本专利技术的第二个目的在于提出一种基于深层类神经网络的骚扰电话识别装置。为达上述目的,本专利技术第一方面实施例基于深层类神经网络的骚扰电话识别方法,包括:收集陌生来电记录建立训练集;提取所述训练集中每条陌生来电记录的行为信息值生成多维向量,对所述训练集中每条陌生来电记录进行标记,所述标记用于表示该陌生来电号码是否为骚扰电话;构建深层类神经网络,所述深层类神经网络依次包括输入层、多个抽象层和输出层;使用所述训练集中的陌生来电记录的多维向量训练所述深层类神经网络,使得所述深层类神经网络能够正确识别所述训练集中的每条陌生来电记录是否为骚扰电话;其中,所述输入层的大小与所述多维向量大小一致;采集陌生来电号码的行为信息生成多维向量,然后输入到训练好的所述深度神经网络中,根据所述深层类神经网络的输出层特征值判断所述陌生来电是否为骚扰电话。本专利技术实施例基于深层类神经网络的骚扰电话识别方法,基于深层类神经网络技术,通过挖掘陌生来电记录的行为信息生成多维数据特征向量,然后输入到深层类神经网络,借由反向传播算法进行反复训练提升深层类神经网络对骚扰电话的识别率。由于计算机性能的大幅度进步,使用深层类神经网络算法,简化过去需为了特征截取所需耗费的人力等资源,同时也更加节省所需的模型训练及测试的计算时间。在第一方面的一种可能的实现形式中,所述收集陌生来电记录建立训练集,包括:根据所述陌生来电的号码信息收集相同国家的陌生来电记录建立训练集。在第一方面的另一种可能的实现形式中,该识别方法还包括:将判定为骚扰电话的陌生来电号码存入相应国家的骚扰电话黑名单数据库中。在第一方面的另一种可能的实现形式中,所述深层类神经网络具体包括一个输入层、三个抽象层和一个输出层。在第一方面的另一种可能的实现形式中,所述深层类神经网络的抽象层大小与输入层大小一致。在第一方面的另一种可能的实现形式中,所述深层类神经网络的输出层为softmax二元分类器。在第一方面的另一种可能的实现形式中,所述深层类神经网络的输入层大小为9。本专利技术第二方面实施例的基于深层类神经网络的骚扰电话识别装置,包括:训练模块,用于收集陌生来电记录建立训练集;提取所述训练集中每条陌生来电记录的行为信息值生成多维向量,对所述训练集中每条陌生来电记录进行标记,所述标记用于表示该陌生来电号码是否为骚扰电话;深层类神经网络模型,用于构建深层类神经网络,所述深层类神经网络依次包括输入层、多个抽象层和输出层;使用所述训练集中的陌生来电记录的多维向量训练所述深层类神经网络,使得所述深层类神经网络能够正确识别所述训练集中的每条陌生来电记录是否为骚扰电话;其中,所述输入层的大小与所述多维向量大小一致;接口模块,用于采集陌生来电号码的行为信息生成多维向量,然后输入到训练好的所述深层类神经网络中,根据所述深层类神经网络的输出层特征值判断所述陌生来电是否为骚扰电话。在第二方面的一种可能的实现形式中,所述训练模块包括:分类子模块,用于根据所述陌生来电的号码信息收集相同国家的陌生来电记录建立训练集。在第二方面的另一种可能的实现形式中,所述装置还包括:存储模块,用于根据所述深层类神经网络的输出层特征值判断出所述陌生来电是否为骚扰电话之后,将所述陌生来电信息和判断结果存储在云端的数据库中。在第二方面的另一种可能的实现形式中,所述深层类神经网络具体包括一个输入层、三个抽象层和一个输出层。在第二方面的另一种可能的实现形式中,所述深层类神经网络的抽象层大小与输入层大小一致。在第二方面的另一种可能的实现形式中,所述深层类神经网络的输出层采用sigmoid二元分类器。在第二方面的另一种可能的实现形式中,所述深层类神经网络的输入层大小为9。本专利技术实施例的识别装置,基于陌生来电记录的训练集和深层类神经网络,使用反向传播算法对构建的深层类神经网络进行反复的模型训练,由此大大提高了骚扰电话识别效率,降低了人工识别的资源消耗,当需要检测新产生的陌生来电号码信息时能够迅速识别出骚扰电话,及时帮助用户拒绝骚扰电话,帮助用户降低各类损失。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术构建的深层类神经网络示意图;图2是根据本专利技术一个实施例基于深层类神经网络的骚扰电话识别方法的流程图;图3是根据本专利技术一个实施例基于深层类神经网络的骚扰电话识别装置结构示意图;图4是根据本专利技术一个实施例基于深层类神经网络的骚扰电话识别系统示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。深层类神经网络(DeepNeuralNetwork,DNN),是由多个神经元组成,属于前向式类神经网络的一种。深层类神经网络主要是由输入层、抽象层和输出层所组成,可借由调整连结间的权重以及输入不各种不同的特征来达成学习目的,每一层都有神经元的输入,其中输入为前一层神经元的输出(如图1所示),最后输入特定单元且对应到某一特定分类,并透过反向传播算法促使训练集达到反复的学习。下面参考附图描述本专利技术实施例的基于深层类神经本文档来自技高网...
基于深层类神经网络的骚扰电话识别方法和装置

【技术保护点】
一种基于深层类神经网络的骚扰电话识别方法,其特征在于,包括以下步骤:收集陌生来电记录建立训练集;提取所述训练集中每条陌生来电记录的行为信息值生成多维向量,对所述训练集中每条陌生来电记录进行标记,所述标记用于表示该陌生来电号码是否为骚扰电话;构建深层类神经网络,所述深层类神经网络依次包括输入层、多个抽象层和输出层;使用所述训练集中的陌生来电记录的多维向量训练所述深层类神经网络,使得所述深层类神经网络能够正确识别所述训练集中的每条陌生来电记录是否为骚扰电话;其中,所述输入层的大小与所述多维向量大小一致;采集陌生来电号码的行为信息生成多维向量,然后输入到训练好的所述深层类神经网络中,根据所述深层类神经网络的输出层特征值判断所述陌生来电是否为骚扰电话。

【技术特征摘要】
1.一种基于深层类神经网络的骚扰电话识别方法,其特征在于,包括以下步骤:收集陌生来电记录建立训练集;提取所述训练集中每条陌生来电记录的行为信息值生成多维向量,对所述训练集中每条陌生来电记录进行标记,所述标记用于表示该陌生来电号码是否为骚扰电话;构建深层类神经网络,所述深层类神经网络依次包括输入层、多个抽象层和输出层;使用所述训练集中的陌生来电记录的多维向量训练所述深层类神经网络,使得所述深层类神经网络能够正确识别所述训练集中的每条陌生来电记录是否为骚扰电话;其中,所述输入层的大小与所述多维向量大小一致;采集陌生来电号码的行为信息生成多维向量,然后输入到训练好的所述深层类神经网络中,根据所述深层类神经网络的输出层特征值判断所述陌生来电是否为骚扰电话。2.如权利要求1所述的方法,其特征在于,所述收集陌生来电记录建立训练集,包括:根据所述陌生来电的号码信息收集相同国家的陌生来电记录建立训练集。3.如权利要求2所述的方法,其特征在于,所述方法还包括:根据所述深层类神经网络的输出层特征值判断出所述陌生来电是否为骚扰电话之后,将所述陌生来电信息和判断结果存储在云端的数据库中。4.如权利要求1所述的方法,其特征在于,所述深层类神经网络具体包括一个输入层、三个抽象层和一个输出层。5.如权利要求4所述的方法,其特征在于,所述深层类神经网络的抽象层大小与输入层大小一致。6.如权利要求...

【专利技术属性】
技术研发人员:黃獻德
申请(专利权)人:北京金山安全软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1