基于用户隐私保护的电信欺诈检测系统及方法技术方案

技术编号：15655161 阅读：140 留言：0更新日期：2017-06-17 13:10

本发明专利技术提供一种基于用户隐私保护的电信欺诈检测系统及方法，能够提供一种多个运营商系统合作来检测诈骗的新方式，由此借助参考运营商系统中的已知诈骗者数据，能够找出隐藏在其他运营商系统中的可能诈骗者；而且通过LDA模型以及MMD计算方式，既可以找出传统的电信诈骗者，也可以找出变化多端的电信诈骗者，检测准确率大大提高；此外，还应用了差分隐私的方式来保证在检测诈骗者的同时限制多个运营商系统之间的数据传阅，从而不会泄露某些特殊用户账号的隐私记录和数据。

全部详细技术资料下载

【技术实现步骤摘要】
基于用户隐私保护的电信欺诈检测系统及方法
本专利技术涉及电信欺诈检测
，尤其涉及一种基于用户隐私保护的电信欺诈检测系统及方法。
技术介绍
随着移动运营商的用户数量激增，电信诈骗对用户以及运营商都造成了严重的损失。为了检测出电信诈骗活动，许多研究学者提出了很多诸如机器学习、数据模型以及其他方式来解决问题，例如BoltonR.J.【BoltonR.J.,HandD.J.,Statisticalfrauddetection:Areview,Statisticalscience,2002:235-249】描述了如何使用数据模型来帮助运营商检测诈骗；WeatherfordM.【WeatherfordM.,Miningforfraud,IEEEIntelligentSystems,2002,17(4):4-6】专注于使用神经网络模型并结合历史记录生成正常用户长期的使用模式来检测电信诈骗活动。而目前更有许多公司开发了相应的软件来检测电信诈骗，例如TransNexus公司开发了一个叫做NexOSS的软件系统，该软件系统使用VoIP网络来检测诈骗活动。随着移动运营商的服务范围的扩大，检测和识别移动运营商中的诈骗者及其行为也越来越重要，由此使得学术界对于检测和识别移动运营商中的诈骗者也越来越感兴趣，并且提出了许多策略来防止诈骗者的攻击和诈骗活动，例如BeckerR.A.【BeckerR.A.,VolinskyC.,WilksA.R.,Frauddetectionintelecommunications:Historyandlessonslearned,Technomet...
基于用户隐私保护的电信欺诈检测系统及方法

【技术保护点】
一种基于用户隐私保护的电信欺诈检测系统，其特征在于，包括：数据提取模块，用于从参考运营商系统的数据库中提取已知诈骗者账户对应的CDR数据及相关数据，以及从待检测运营商系统的用户数据库中提取待检测用户账户对应的CDR数据及相关数据；CDR分析模块，用于根据所述数据提取模块提取的所述已知诈骗者账户对应的CDR数据及相关数据，来形成所述已知诈骗者账户及其诈骗行为和习惯的特征描述文件，以及用于根据所述数据提取模块提取的所述待检测用户账户对应的CDR数据及相关数据，来形成所述待检测用户账户及其行为和习惯的特征描述文件；匹配检测模块，用于计算所述CDR分析模块中所述待检测用户账户的特征描述文件和所述已知诈骗者账户的特征描述文件之间的MMD，以确定所述待检测用户账户是否是所述待检测运营商系统中的可能诈骗者；结果输出模块，用于输出所述匹配检测模块确定的所述待检测运营商系统中的可能诈骗者信息；用户隐私保护模块，用于在所述匹配检测模块向所述CDR分析模块请求描述数据时，限制所述CDR分析模块的数据输出。

【技术特征摘要】
1.一种基于用户隐私保护的电信欺诈检测系统，其特征在于，包括：数据提取模块，用于从参考运营商系统的数据库中提取已知诈骗者账户对应的CDR数据及相关数据，以及从待检测运营商系统的用户数据库中提取待检测用户账户对应的CDR数据及相关数据；CDR分析模块，用于根据所述数据提取模块提取的所述已知诈骗者账户对应的CDR数据及相关数据，来形成所述已知诈骗者账户及其诈骗行为和习惯的特征描述文件，以及用于根据所述数据提取模块提取的所述待检测用户账户对应的CDR数据及相关数据，来形成所述待检测用户账户及其行为和习惯的特征描述文件；匹配检测模块，用于计算所述CDR分析模块中所述待检测用户账户的特征描述文件和所述已知诈骗者账户的特征描述文件之间的MMD，以确定所述待检测用户账户是否是所述待检测运营商系统中的可能诈骗者；结果输出模块，用于输出所述匹配检测模块确定的所述待检测运营商系统中的可能诈骗者信息；用户隐私保护模块，用于在所述匹配检测模块向所述CDR分析模块请求描述数据时，限制所述CDR分析模块的数据输出。2.如权利要求1所述的电信欺诈检测系统，其特征在于，所述数据提取模块包括参考数据提取模块和检测数据提取模块，其中，参考数据提取模块用于从参考运营商系统的数据库中提取已知诈骗者列表以及列表中所有的已知诈骗者账户的CDR数据及相关数据，并发送至CDR分析模块；检测数据提取模块用于从待检测运营商系统的用户数据库中提取一个或多个或所有用户账户的CDR数据及相关数据并发送至CDR分析模块。3.如权利要求1所述的电信欺诈检测系统，其特征在于，所述CDR分析模块包括LDA单元，用于基于接收的每个账户的CDR数据和相关数据来使用LDA模型描述所述账户的行为和习惯，以生成所述账户的特征描述文件。4.如权利要求3所述的电信欺诈检测系统，其特征在于，所述LDA模型对每个账户的描述公式为：其中，aLDA表示一个账户，cn表示这个账户的拨号，γin表示自由变化的参数，θ为k维的狄利克雷随机参数,K为潜在类的数量，p为概率分布函数。5.如权利要求1所述的电信欺诈检测系统，其特征在于，所述匹配检测模块包括MMD单元和匹配单元，其中，所述MMD单元用于向所述CDR分析模块请求当前检测的所述待检测运营商系统中的用户账户的特征描述文件以及相应的所述参考运营商系统中的已知诈骗者账户的特征描述文件，并计算所述当前检测的用户账户的特征描述文件与获取到的所有的所述参考运营商系统中的已知诈骗者的特征描述文件之间的MMD；所述匹配单元用于根据所述MMD单元计算出的所述当前检测的用户账户对应的所有MMD，来判断所述当前检测的用户账户是否是隐藏在所述待检测运营商系统中的可能诈骗者。6.如权利要求5所述的电信欺诈检测系统，其特征在于，所述MMD单元计算两个账户的特征描述文件之间的MMD公式为：其中，F为函数类，是再生核希尔伯特空间中的一个单位球，f为函数类F中的目击函数，Px和Py分别为两个账户的特征描述文件，xi为在特征描述文件Px中的第i个样本，yi为在特征描述文件Py中的第i个样本，当且仅当Px＝Py时，MMD[F，Px，Py]＝0，目击函数f及其经验估计定义如下：式中，k为高斯核心函数，xc为核心函数的中心，σ为核心函数的宽度，用于控制它的影响域。7.如权利要求6所述的电信欺诈检测系统，其特征在于，所述用户隐私模块向所述MMD单元加入拉普拉斯算子噪声来实现差分隐私，噪声加入公式如下：式中，Γ表示Gamm...

【专利技术属性】
技术研发人员：阮娜，贾维嘉，赵铭，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人