基于用户隐私保护的电信欺诈检测系统及方法技术方案

技术编号:15655161 阅读:140 留言:0更新日期:2017-06-17 13:10
本发明专利技术提供一种基于用户隐私保护的电信欺诈检测系统及方法,能够提供一种多个运营商系统合作来检测诈骗的新方式,由此借助参考运营商系统中的已知诈骗者数据,能够找出隐藏在其他运营商系统中的可能诈骗者;而且通过LDA模型以及MMD计算方式,既可以找出传统的电信诈骗者,也可以找出变化多端的电信诈骗者,检测准确率大大提高;此外,还应用了差分隐私的方式来保证在检测诈骗者的同时限制多个运营商系统之间的数据传阅,从而不会泄露某些特殊用户账号的隐私记录和数据。

【技术实现步骤摘要】
基于用户隐私保护的电信欺诈检测系统及方法
本专利技术涉及电信欺诈检测
,尤其涉及一种基于用户隐私保护的电信欺诈检测系统及方法。
技术介绍
随着移动运营商的用户数量激增,电信诈骗对用户以及运营商都造成了严重的损失。为了检测出电信诈骗活动,许多研究学者提出了很多诸如机器学习、数据模型以及其他方式来解决问题,例如BoltonR.J.【BoltonR.J.,HandD.J.,Statisticalfrauddetection:Areview,Statisticalscience,2002:235-249】描述了如何使用数据模型来帮助运营商检测诈骗;WeatherfordM.【WeatherfordM.,Miningforfraud,IEEEIntelligentSystems,2002,17(4):4-6】专注于使用神经网络模型并结合历史记录生成正常用户长期的使用模式来检测电信诈骗活动。而目前更有许多公司开发了相应的软件来检测电信诈骗,例如TransNexus公司开发了一个叫做NexOSS的软件系统,该软件系统使用VoIP网络来检测诈骗活动。随着移动运营商的服务范围的扩大,检测和识别移动运营商中的诈骗者及其行为也越来越重要,由此使得学术界对于检测和识别移动运营商中的诈骗者也越来越感兴趣,并且提出了许多策略来防止诈骗者的攻击和诈骗活动,例如BeckerR.A.【BeckerR.A.,VolinskyC.,WilksA.R.,Frauddetectionintelecommunications:Historyandlessonslearned,Technometrics,2012】提出的多种电信诈骗检测方法中的一种为EarlyThreshold-BasedAlerting检测方法,该检测方法使用历史数据来找到一个界限来区分正常用户和诈骗用户,然而现实场景中由于用户有着许多不同的行为,导致此种检测方法会错误地将正常用户界定为诈骗用户;BeckerR.A.【BeckerR.A.,VolinskyC.,WilksA.R.,Frauddetectionintelecommunications:Historyandlessonslearned,Technometrics,2012】提出的另一种电信诈骗检测方法为Signature-BasedAlerting检测方法,它的基本思路是描述移动运营商用户的行为,并根据用户行为找到一个界限来区分正常用户和诈骗用户,这就需要一种能够准确且高效的描述方式。另外,YusoffM.I.M.【YusoffM.I.M.,MohamedI.,BakarM.R.A.,FrauddetectionintelecommunicationindustryusingGaussianmixedmodel,2013InternationalConferenceonResearchandInnovationinInformationSystems(ICRIIS).IEEE,2013:27-32】提出了使用诸如GaussianMixedModel等数据模型,来描述用户,以检测和识别移动运营商中的诈骗者。尽管目前已有很多检测和识别电信诈骗的技术,但是在此领域中依然存在许多挑战:1、诈骗者总是倾向于隐藏他们的身份,以及通过多个移动运营商来实施诈骗活动,这使得先前的一些检测诈骗的方法无法检测出他们奇怪的行为模式,准确率下降,检测的成本变高。基于此,OlszewskiD.【OlszewskiD.,Aprobabilisticapproachtofrauddetectionintelecommunications,Knowledge-BasedSystems,2012,26:246-258)提出了使用LDA(latentDirichletAllocation】来描述用户,他们建立了一个自动的界限来检测单一运营商中的诈骗者,但几乎无法检测到隐藏在多个运营商中的诈骗者。2、在移动运营商中,有大量的数据需要被同时分析,但是仅仅只有少数的诈骗电话样本以供本实施例中学习他们的行为模式。例如,HeneckaW.【HeneckaW.,RoughanM.,Privacy-PreservingFraudDetectionAcrossMultiplePhoneRecordDatabases,IEEETransactionsonDependableandSecureComputing,2015,12(6):640-651】提出了一个基于多个数据库的诈骗检测方式,但是他们仅仅使用了用户的一个特征来描述用户,并且他们的匹配策略只关注两个特征的距离,因此他们的模型准确率有待提高。3、如果通过多个运营商合作来检测诈骗,他们势必会交换数据。因此在检测欺诈者过程中,攻击者有机会得到单个用户的私人电话数据,这会对一般用户的隐私安全造成巨大的威胁。因此,需要一种新的电信欺诈检测策略,能够检测多个移动运营商中诈骗者,提高检测准确率,同时保护用户的数据隐私。
技术实现思路
本专利技术的目的在于提供一种基于用户隐私保护的电信欺诈检测系统及方法,能够检测多个移动运营商中诈骗者,提高检测准确率,同时保护用户的数据隐私。为解决上述问题,本专利技术提出一种基于用户隐私保护的电信欺诈检测系统,包括:本专利技术提出的一种基于用户隐私保护的电信欺诈检测系统,包括:数据提取模块,用于从参考运营商系统的数据库中提取已知诈骗者账户对应的CDR数据及相关数据,以及从待检测运营商系统的用户数据库中提取待检测用户账户对应的CDR数据及相关数据;CDR分析模块,用于根据所述数据提取模块提取的所述已知诈骗者账户对应的CDR数据及相关数据,来形成所述已知诈骗者账户及其诈骗行为和习惯的特征描述文件,以及用于根据所述数据提取模块提取的所述待检测用户账户对应的CDR数据及相关数据,来形成所述待检测用户账户及其行为和习惯的特征描述文件;匹配检测模块,用于计算所述CDR分析模块中所述待检测用户账户的特征描述文件和所述已知诈骗者账户的特征描述文件之间的MMD,以确定所述待检测用户账户是否是所述待检测运营商系统中的可能诈骗者;结果输出模块,用于输出所述匹配检测模块确定的所述待检测运营商系统中的可能诈骗者信息;用户隐私保护模块,用于在所述匹配检测模块向所述CDR分析模块请求描述数据时,限制所述CDR分析模块的数据输出。进一步的,所述数据提取模块包括参考数据提取模块和检测数据提取模块,其中,参考数据提取模块用于从参考运营商系统的数据库中提取已知诈骗者列表以及列表中所有的已知诈骗者账户的CDR数据及相关数据,并发送至CDR分析模块;检测数据提取模块用于从待检测运营商系统的用户数据库中提取一个或多个或所有用户账户的CDR数据及相关数据并发送至CDR分析模块。进一步的,所述CDR分析模块包括LDA单元,用于基于接收的每个账户的CDR数据和相关数据来使用LDA模型描述所述账户的行为和习惯,以生成所述账户的特征描述文件。进一步的,所述LDA模型对每个账户的描述公式为:其中,aLDA表示一个账户,cn表示这个账户的拨号,γin表示自由变化的参数,θ为k维的狄利克雷随机参数,K为潜在类的数量。进一步的,所述匹配检测模块包括MMD本文档来自技高网
...
基于用户隐私保护的电信欺诈检测系统及方法

【技术保护点】
一种基于用户隐私保护的电信欺诈检测系统,其特征在于,包括:数据提取模块,用于从参考运营商系统的数据库中提取已知诈骗者账户对应的CDR数据及相关数据,以及从待检测运营商系统的用户数据库中提取待检测用户账户对应的CDR数据及相关数据;CDR分析模块,用于根据所述数据提取模块提取的所述已知诈骗者账户对应的CDR数据及相关数据,来形成所述已知诈骗者账户及其诈骗行为和习惯的特征描述文件,以及用于根据所述数据提取模块提取的所述待检测用户账户对应的CDR数据及相关数据,来形成所述待检测用户账户及其行为和习惯的特征描述文件;匹配检测模块,用于计算所述CDR分析模块中所述待检测用户账户的特征描述文件和所述已知诈骗者账户的特征描述文件之间的MMD,以确定所述待检测用户账户是否是所述待检测运营商系统中的可能诈骗者;结果输出模块,用于输出所述匹配检测模块确定的所述待检测运营商系统中的可能诈骗者信息;用户隐私保护模块,用于在所述匹配检测模块向所述CDR分析模块请求描述数据时,限制所述CDR分析模块的数据输出。

【技术特征摘要】
1.一种基于用户隐私保护的电信欺诈检测系统,其特征在于,包括:数据提取模块,用于从参考运营商系统的数据库中提取已知诈骗者账户对应的CDR数据及相关数据,以及从待检测运营商系统的用户数据库中提取待检测用户账户对应的CDR数据及相关数据;CDR分析模块,用于根据所述数据提取模块提取的所述已知诈骗者账户对应的CDR数据及相关数据,来形成所述已知诈骗者账户及其诈骗行为和习惯的特征描述文件,以及用于根据所述数据提取模块提取的所述待检测用户账户对应的CDR数据及相关数据,来形成所述待检测用户账户及其行为和习惯的特征描述文件;匹配检测模块,用于计算所述CDR分析模块中所述待检测用户账户的特征描述文件和所述已知诈骗者账户的特征描述文件之间的MMD,以确定所述待检测用户账户是否是所述待检测运营商系统中的可能诈骗者;结果输出模块,用于输出所述匹配检测模块确定的所述待检测运营商系统中的可能诈骗者信息;用户隐私保护模块,用于在所述匹配检测模块向所述CDR分析模块请求描述数据时,限制所述CDR分析模块的数据输出。2.如权利要求1所述的电信欺诈检测系统,其特征在于,所述数据提取模块包括参考数据提取模块和检测数据提取模块,其中,参考数据提取模块用于从参考运营商系统的数据库中提取已知诈骗者列表以及列表中所有的已知诈骗者账户的CDR数据及相关数据,并发送至CDR分析模块;检测数据提取模块用于从待检测运营商系统的用户数据库中提取一个或多个或所有用户账户的CDR数据及相关数据并发送至CDR分析模块。3.如权利要求1所述的电信欺诈检测系统,其特征在于,所述CDR分析模块包括LDA单元,用于基于接收的每个账户的CDR数据和相关数据来使用LDA模型描述所述账户的行为和习惯,以生成所述账户的特征描述文件。4.如权利要求3所述的电信欺诈检测系统,其特征在于,所述LDA模型对每个账户的描述公式为:其中,aLDA表示一个账户,cn表示这个账户的拨号,γin表示自由变化的参数,θ为k维的狄利克雷随机参数,K为潜在类的数量,p为概率分布函数。5.如权利要求1所述的电信欺诈检测系统,其特征在于,所述匹配检测模块包括MMD单元和匹配单元,其中,所述MMD单元用于向所述CDR分析模块请求当前检测的所述待检测运营商系统中的用户账户的特征描述文件以及相应的所述参考运营商系统中的已知诈骗者账户的特征描述文件,并计算所述当前检测的用户账户的特征描述文件与获取到的所有的所述参考运营商系统中的已知诈骗者的特征描述文件之间的MMD;所述匹配单元用于根据所述MMD单元计算出的所述当前检测的用户账户对应的所有MMD,来判断所述当前检测的用户账户是否是隐藏在所述待检测运营商系统中的可能诈骗者。6.如权利要求5所述的电信欺诈检测系统,其特征在于,所述MMD单元计算两个账户的特征描述文件之间的MMD公式为:其中,F为函数类,是再生核希尔伯特空间中的一个单位球,f为函数类F中的目击函数,Px和Py分别为两个账户的特征描述文件,xi为在特征描述文件Px中的第i个样本,yi为在特征描述文件Py中的第i个样本,当且仅当Px=Py时,MMD[F,Px,Py]=0,目击函数f及其经验估计定义如下:式中,k为高斯核心函数,xc为核心函数的中心,σ为核心函数的宽度,用于控制它的影响域。7.如权利要求6所述的电信欺诈检测系统,其特征在于,所述用户隐私模块向所述MMD单元加入拉普拉斯算子噪声来实现差分隐私,噪声加入公式如下:式中,Γ表示Gamm...

【专利技术属性】
技术研发人员:阮娜贾维嘉赵铭
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1