基于声纹识别和意图理解技术的反诈骗系统的自学习方法技术方案

技术编号:19552228 阅读:30 留言:0更新日期:2018-11-24 22:07
本发明专利技术公开了基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。本发明专利技术利用声纹预警数据自动为意图理解模型积累训练用诈骗文本;利用意图理解预警数据自动添加诈骗人声纹模型库,两种技术手段互相补充,有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。

Self-learning method of anti-fraud system based on voiceprint recognition and intention understanding technology

The invention discloses a self-learning method of an anti-fraud system based on voiceprint recognition and intention understanding technology, which is characterized by the following steps: S1: establishing a fraudster's voiceprint model library and a fraudster's intent model library; S2: renewal steps of the fraudster's voiceprint model library; and S3: a fraudster's intent model. Library update steps. The invention uses voiceprint early warning data to automatically accumulate training fraud text for intent understanding model; automatically adds fraudster voiceprint model library for intent understanding early warning data, and the two technical means complement each other to effectively solve the problem of false alarm of new fraudster during data accumulation and manual accumulation of training text for intent understanding model.

【技术实现步骤摘要】
基于声纹识别和意图理解技术的反诈骗系统的自学习方法
本专利技术涉及基于声纹识别和意图理解技术的反诈骗系统的自学习方法,属于通讯安全

技术介绍
随着诈骗分子的不断涌现,电话诈骗在国内产生了严重的影响,为了有效的打击电话诈骗,目前国内已有很多不同的诈骗电话检出方法,主要为基于电信运营商信令数据进行实时分析以及基于诈骗录音比对两条技术路线。其中基于信令的诈骗电话检出方法主要基于诈骗通话明显的通话特征,对于通话特征不明显的诈骗电话无法有效检出。而基于诈骗录音比对的诈骗电话检出方法依赖于预先建立的诈骗录音库,通过音频比对的技术检出诈骗听话,该方法主要针对录音型电话,对于自然人诈骗电话无能为力。利用智能语音处理方案预警时,随着诈骗分子的不断涌现,诈骗手段的持续更新,预先积累的诈骗人声纹库需要持续不断的更新,针对诈骗剧本的意图理解模型也要不断的优化,以适应不断变化的诈骗手段,因此我们需要建立学习系统,旨在通过对预警数据的分析,通过语音处理和意图模型训练的流程,向平台不断输入新的诈骗人声纹模型及优化后的意图理解模型,不断优化系统效果。现有的学习系统是基于对预警数据进行人工听音标注,由优化人员定期对预警数据进行处理分析,提取出符合系统注册标准的诈骗人声纹模型,并在已积累的诈骗剧本的基础上,更新线上意图理解模型。该方式有效地对线上的声纹及意图模型进行更新及优化,但该方案中声纹和意图是互相独立的模块,声纹模型处理流程是在积累了一定的数据量后,批量对其进行处理并注册上线,时效性不高,尤其对新的诈骗人声纹模型,无法及时对新发现的诈骗人声纹模型进行注册上线。意图模型处理流程同样需要积累大量的诈骗文本后方可训练优化模型,通过固定的引流策略引入通话数据,人工复听这些通话数据发现新诈骗文本实现大量训练文本的积累,这种积累方式引起引流策略相对盲目导致人工工作量太大,训练数据积累耗时很长且往往效果不佳。
技术实现思路
针对上述不足,提出了基于声纹识别和意图理解技术的反诈骗系统的自学习方法,该方案通过声纹识别和意图理解技术实现。声纹识别技术基于预先积累的诈骗人声纹库,通过计算声纹模型之间的相似度对诈骗电话进行检出。意图理解技术则通过积累的诈骗文本训练意图理解模型,实时对输入的通话进行意图判断,并进行预警处置。本专利技术采用如下技术方案:基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。作为一种较佳的实施例,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库,然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。作为一种较佳的实施例,所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括:预警数据输入诈骗人声纹模型库中,并与诈骗人声纹模型库中的声纹预警门限值进行比对,若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库,然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。本专利技术所达到的有益效果:本专利技术利用声纹预警数据自动为意图理解模型积累训练用诈骗文本;利用意图理解预警数据自动添加诈骗人声纹模型库,两种技术手段互相补充,有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。附图说明图1是本专利技术的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。如图1所示的是本专利技术的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。本专利技术提出的声纹加意图的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。作为一种较佳的实施例,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库,然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。作为一种较佳的实施例,所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括:预警数据输入诈骗人声纹模型库中,并与诈骗人声纹模型库中的声纹预警门限值进行比对,若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库,然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。本专利技术的技术方案通过调整声纹及意图预警的门限值,对于声纹高门限单独预警的诈骗文本和意图理解高门限预警的诈骗人声纹进行系统的自动处理。需要说明的是,本专利技术具体对于声纹高门限单独预警的通话,定义其声纹为系统中已存在诈骗人员声纹模型,但其诈骗套路为新诈骗剧本,通过该种方式可以有效为意图理解模型收集新训练资源,补充意图理解模型无法发现自动新诈骗剧本的劣势。而对于意图理解高门限单独预警的通话数据,定义为意图理解模型中存在该种诈骗剧本的模型,但是未获取到该通通话的诈骗人声纹,通过系统自动的判别诈骗人员声纹,并对其进行声纹的去燥等处理,注册为诈骗人声纹模型,在声纹入库时,需将其与现有声纹库中已有的声纹模型进行声纹碰撞,再次判断是否为新增声纹,弥补声纹模型训练数据积累期间无法发现新诈骗通话的不足。以上所述仅是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员来说,在不脱离本专利技术技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本专利技术的保护范围。本文档来自技高网
...

【技术保护点】
1.基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。

【技术特征摘要】
1.基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。2.根据权利要求1所述的基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限...

【专利技术属性】
技术研发人员:张震李鹏黄远高圣翔谭昶柳林倪江帆杜裕琴罗雅赛
申请(专利权)人:国家计算机网络与信息安全管理中心讯飞智元信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1