一种骚扰电话的识别方法技术

技术编号:17780476 阅读:43 留言:0更新日期:2018-04-22 09:23
本发明专利技术公开了一种骚扰电话的识别方法。建立基于反向传播神经网络的骚扰电话识别模型;设计了所述反向传播神经网络的输入、输出变量;设计了粒子群算法计算初始反向传播神经网络参数,提高所述反向传播神经网络的精度和收敛速度;分别提出了建立训练数据集和验证数据集的方法,提高训练效率;通过计算所述反向传播神经网络的识别效果评估值,以识别效果评估值最大的反向传播神经网络识别主叫号码是骚扰电话、还是正常电话、还是疑似骚扰电话。本发明专利技术提出的骚扰电话的识别方法具有准确、快捷的特点,防电话骚扰效果良好。

【技术实现步骤摘要】
一种骚扰电话的识别方法
本专利技术属于通信大数据领域,具体涉及一种骚扰电话的识别方法。
技术介绍
在大数据时代,移动通信飞速发展在给人们带来方便的同时,也使得有些人出于商业目的,利用移动通信业务传播一些骚扰信息,导致骚扰电话泛滥,给人们的生活带来极大困扰。如何有效甄别骚扰电话,构建绿色安全网络,对骚扰电话的识别和监控拦截技术的研究成了当下的热点问题。
技术实现思路
本专利技术的目的是为了解决目前现有的技术存在的不足,提出了一种粒子群算法优化反向传播神经网络骚扰电话识别方法。建立基于反向传播神经网络的骚扰电话识别模型;设计了所述反向传播神经网络的输入、输出变量;设计了粒子群算法计算初始反向传播神经网络参数,提高所述反向传播神经网络的精度和收敛速度;分别提出了建立训练数据集和验证数据集的方法,提高训练效率;通过计算所述反向传播神经网络的识别效果评估值,以识别效果评估值最大的反向传播神经网络识别主叫号码是骚扰电话、还是正常电话、还是疑似骚扰电话。一种骚扰电话的识别方法,其特征在于,包括以下步骤:S1、建立基于反向传播神经网络的骚扰电话识别模型:其中,x1,x2,..,xn为输入变量,n为输入层节点数,n1为隐含层节点数,wij(0≤wij≤1,i=1,2,…,n,j=1,2,…,n1)为输入层至隐含层的权值,隐含层的输出变量,θj(j=1,2,…,n1)为输入层至隐含层的阈值;m为输出层节点数,w′jk(0≤w′jk≤1,j=1,2,…,n1,k=1,2,…,m)为隐含层至输出层的权值;y为隐含层至输出层的输出变量;θk′(k=1,2,…,m)为隐含层至输出层的阈值;f(z)为Sigmoid函数,如式(2)所示:S2、定义式(1)所述反向传播神经网络的输入、输出变量,进一步包含如下步骤:S2-1:定义式(1)所述反向传播神经网络的输入变量,进一步包括:式(1)所述x1,x2,..,xn为指定主叫号码在连续7天中的相关统计数据,其中x1:总呼叫次数;x2:被叫号码数,即主叫呼出号码的数量;x3:接通次数;x4:接通号码数,接通情况下主叫呼出号码的数量;x5:平均通话时间;x6:未接通次数;x7:未接通号码数,未接通情况下主叫呼出号码的数量;x8:0时到7时的呼叫次数;x9:7时到10时的呼叫次数;x10:10时到14时的呼叫次数;x11:14时到18时的呼叫次数;x12:18时到21时的呼叫次数;x13:21时到24时的呼叫次数。S2-2:定义式(1)所述反向传播神经网络输出层节点的输出变量y:y(0≤y≤1)为所述主叫号码是骚扰电话的置信度,即所述主叫号码为骚扰电话的概率。S3、设计粒子群算法,计算初始反向传播神经网络参数:wij,W′jk,进一步包括:S3-1:编码粒子群个体:将初始化反向传播神经网络参数wij,w′jk作为一个整体参数进行编码,每一个个体都包含了反向传播神经网络的输入层至隐含层的权值,隐含层至输出层的权值。S3-2:确定速度更新函数和位置更新函数,如式(3)、(4)vi(t+1)=vi(t)+c1*r1(t)*(pi(t)-xi(t))+c2*r2(t)*(pg(t)-xi(t))(3)xi(t+1)=xi(t)+vi(t+1)(4)其中:xi(t)表示第i(i=1,2,...,n)个粒子第t次迭代时的位置向量;vi(t)表示第i(i=1,2,...,n)个粒子第t次迭代时的速度向量;pi(t)表示第i(i=1,2,...,n)个粒子第t次迭代时的最优位置向量;pg(t)表示整个种群的t次迭代时经过的最优位置向量;c1,c2为学习因子(正常数);r1,r2为[0,1]之间满足均匀分布的随机数。S3-3:计算每个粒子的适应度值。S3-4:对每个粒子i,比较它的适应值与它的个体极值pi(t),如果当前值好于pi(t),则替换pi(t),否则,pi(t)等于当前位置xi。S3-5:对每个粒子i,比较它的适应值与全局极值pg(t),如果当前值较好,则替换pg(t)pg(t)。S3-6:根据式(3)、(4)更新粒子的速度和位置。S3-7:如果满足运行结束条件(误差足够好或达到了预先设定的最大迭代次数),则退出,输出最优解,否则,回到S3-3。S3-8:解码最优个体。对粒子群个体解码,得到wij,w′jk。S4、建立训练数据集S和验证数据集T。S4-1:S和T来源于连续7天的通话记录。S4-2:设7天通话记录中的主叫号码集合为U、骚扰电话号码集合为P、疑似骚扰电话号码集合为Q、正常电话号码(即既非骚扰电话,也非疑似骚扰电话)集合为R。S4-3:定义置信度:P中元素置信度定为1、Q中元素置信度定为random(45,55)*0.01、R中元素置信度定为0。S4-4:确定训练数据集S,进一步包括:S4-4-1:确定S中骚扰电话号码集合SP,SP中元素的个数为min{[|P|*0.9],2500},SP中的元素随机地在P中选取。S4-4-2:确定S中疑似骚扰电话号码集合SQ,SQ中元素的个数为min{[|Q|*0.6],700},SQ中的元素随机地在Q中选取。S4-4-3:确定S中正常电话号码集合SR,SR中元素的个数为min{[|R|*0.9],2500},SR中的元素随机地在R中选取。S4-5:确定验证数据集T,进一步包括:S4-5-1:确定T中骚扰电话号码集合TP,TP中元素的个数为min{[|P-SP|*0.2],100},TP中的元素随机地在P-SP中选取。S4-5-2:确定T中疑似骚扰电话号码集合TQ,TQ中元素的个数为min{[|Q-SQ|*0.1],100},TQ中的元素随机地在Q-SQ中选取。S4-5-3:确定T中正常电话号码集合TR,TR中元素的个数为min{[|R-SR|*0.2],100},TR中的元素随机地在R-SR中选取。S5、利用S中的电话号码和S3产生的初始值,对所述反向传播神经网络进行训练。S6、利用T中的电话号码对所述反向传播神经网络进行验证,包括如下步骤:S6-1:计算T中骚扰电话号码识别准确的电话号码集合TP1,进一步包括:TP1={x|x∈TP,且x对应的相关统计数据x1,x2,..,xn作为所述反向传播神经网络输入时,对应的输出值y不小于0.9}S6-2:计算T中骚扰电话号码识别准确的电话号码集合TQ1,进一步包括:TQ1={x|x∈TQ,且x对应的相关统计数据x1,x2,..,xn作为所述反向传播神经网络输入时,对应的输出值y小于0.9、大于0.1}S6-3:计算T中骚扰电话号码识别准确的电话号码集合TR1,进一步包括:TR1={x|x∈TR,且x对应的相关统计数据x1,x2,..,xn作为所述反向传播神经网络输入时,对应的输出值y不大于0.1}S7、计算所述反向传播神经网络的识别效果评估值,进一步包括:ω=(5*|TP1|+|TQ1|+5*|TR1|)/(5*|TP|+|TQ|+5*|TR|)S8、S4~S7执行5次,记识别效果评估值最大的反向传播神经网络为OptAN。S9将待识别的主叫号码x对应的相关统计数据x1,x2,..,xn输入到OptAN。S10、计算OptAN的输出y,如果y≥0.9,则主叫号码x为骚扰电话;如果y≤0.1,则主叫号码x为正常电本文档来自技高网...
一种骚扰电话的识别方法

【技术保护点】
一种骚扰电话的识别方法,其特征在于,包括以下步骤:S1、建立基于反向传播神经网络的骚扰电话识别模型:

【技术特征摘要】
1.一种骚扰电话的识别方法,其特征在于,包括以下步骤:S1、建立基于反向传播神经网络的骚扰电话识别模型:其中,x1,x2,..,xn为输入变量,n为输入层节点数,n1为隐含层节点数,wij(0≤wij≤1,i=1,2,…,n,j=1,2,…,n1)为输入层至隐含层的权值,隐含层的输出变量,θj(j=1,2,…,n1)为输入层至隐含层的阈值;m为输出层节点数,w′jk(0≤w′jk≤1,j=1,2,…,n1,k=1,2,…,m)为隐含层至输出层的权值;y为隐含层至输出层的输出变量;θ′k(k=1,2,…,m)为隐含层至输出层的阈值;f(z)为Sigmoid函数,如式(2)所示:S2、定义式(1)所述反向传播神经网络的输入、输出变量;S3、设计粒子群算法,计算初始反向传播神经网络参数:wij,w′jk,进一步包括:S3-1:编码粒子群个体:将初始化反向传播神经网络参数wij,w′jk作为一个整体参数进行编码,每一个个体都包含了反向传播神经网络的输入层至隐含层的权值,隐含层至输出层的权值;S3-2:确定速度更新函数和位置更新函数,如式(3)、(4)vi(t+1)=vi(t)+c1*r1(t)*(pi(t)-xi(t))+c2*r2(t)*(pg(t)-xi(t))(3)xi(t+1)=xi(t)+vi(t+1)(4)其中:xi(t)表示第i(i=1,2,…,n)个粒子第t次迭代时的位置向量;vi(t)表示第i(i=1,2,…,n)个粒子第t次迭代时的速度向量;pi(t)表示第i(i=1,2,…,n)个粒子第t次迭代时的最优位置向量;pg(t)表示整个种群的t次迭代时经过的最优位置向量;c1,c2为学习因子(正常数);r1,r2为[0,1]之间满足均匀分布的随机数;S3-3:计算每个粒子的适应度值;S3-4:对每个粒子i,比较它的适应值与它的个体极值pi(t),如果当前值好于pi(t),则替换pi(t),否则,pi(t)等于当前位置xi;S3-5:对每个粒子i,比较它的适应值与全局极值pg(t),如果当前值较好,则替换pg(t)pg(t);S3-6:根据式(3)、(4)更新粒子的速度和位置;S3-7:如果满足运行结束条件(误差足够好或达到了预先设定的最大迭代次数),则退出,输出最优解,否则,回到S3-3;S3-8:解码最优个体;对粒子群个体解码,得到wij,w′jk;S4、建立训练数据集S和验证数据集T;S5、利用S中的电话号码和S3产生的初始值,对所述反向传播神经网络进行训练;S6、利用T中的电话号码对所述反向传播神经网络进行验证,包括如下步骤:S6-1:计算T中骚扰电话号码识别准确的电话号码集合TP1,进一步包括:TP1={x|x∈TP,且x对应的相关统计数据x1,x2,..,xn作为所述反向传播神经网络输入时,对应的输出值y不小于0.9};S6-2:计算T中骚扰电话号码识别准确的电话号码集合TQ1,进一步包括:TQ1={x|x∈TQ,且x对应的相关统计数据x1,x2,..,xn作为所述反向传播神经网络输入时,对应的输出值y小于0.9、大于0.1};S6-3:计算T中骚扰电话号码识别准确的电话号码集合TR1,进一步包括:TR1={x|x∈TR,且x对应的相关...

【专利技术属性】
技术研发人员:周兆全邵延富
申请(专利权)人:广州市景心科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1