一种在电话满意度调查中检测身份冒充的系统与方法技术方案

技术编号:10014959 阅读:173 留言:0更新日期:2014-05-08 10:04
本发明专利技术提出一种在电话满意度调查中检测身份冒充的系统与方法,解决了以往电话满意度调查中身份冒充检测只能针对单通道电话语音进行检测且处理语音的方式比较粗糙,电话调查语音中存在噪音、回铃音等多种非有效语音等问题。本发明专利技术由待检测语音库101、预处理模块102、说话人语音分割模块103、调查对象声纹库104、声纹训练模块105、调查对象语音库106、验证语音选取模块107、调查对象验证语音库108、声纹验证模块109、得分统计分析模块110和检测报告生成模块111组成。利用声纹识别技术和说话人语音分割技术,检测身份冒充情况,并最终给出清晰可读的身份冒充检测报告,以反映在电话满意度调查中调查数据的真实性。

【技术实现步骤摘要】
一种在电话满意度调查中检测身份冒充的系统与方法
本专利技术涉及声纹识别
,特别是一种在电话满意度调查中检测身份冒充的系统与方法。
技术介绍
在电话满意度调查中,存在调查对象以一充多的身份冒充情况,即调查对象A在不同的电话调查中,分别冒充了B、C、D等其他人的身份。这样的情况会直接影响调查数据的可信度,损害调查任务委托方的利益。以汽车用户满意度调查为例。汽车厂商在渠道管理方面的工作之一便是对经销商进行满意度调查,考核结果直接与经销商利益相关,因为考核分数高的话,厂商会给经销商适当的返利。而某些与经销商发生冲突或对经销商不满意的车主的调查会直接影响经销商在客户满意度方面的最终得分,所以经销商在给厂商的车主档案里会进行这样一些有意的回避或造假。经销商造假的方式之一便是指派一人接听不同电话接受厂商调查,以冒充那些发生冲突或者不满意车主的身份。目前,市场上大部分调查公司仍在依靠人工审查录音记录来排查身份冒充问题,不仅费时费力,而且还难以确保排查结果的准确性。此外,在部分满意度调查案例中,由于涉及到的调查对象数目巨大,人工排查的方式已无法解决问题。随着技术的发展,科学家已发现,人的声音跟人的指纹一样具有唯一性,而声音的这种唯一性特征,我们称之为“声纹”。声纹识别技术属于生物识别技术的一种,是一项根据语音波形中反应说话人生理和行为特征的语音参数,自动识别说话人身份的技术。声纹识别有两类,即说话人辨认和说话人确认。前者用以判断某段语音时若干人中的哪一个人所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如从多人中找到某个特定人时需要辨认技术,而做交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程。我们能利用声纹识别技术从人的声音中识别人的身份信息,而一旦能够从人的声音中识别其身份信息,我们就能解决上述电话满意度调查中的身份冒充问题。近年来,说话人语音分割技术也得到了快速发展,在对广播语音和会议语音的自动分类整理任务中,获得了良好的性能。所谓说话人语音分割,即在一段同时包含N个说话人的录音中,给出“谁在什么时候说话”的信息。说话人语音分割技术的发展,使得对多通道录音资料的处理成为可能。目前市场上,已有部分软件系统基于声纹识别技术对电话满意度调查中的语音进行身份冒充检测,但是存在如下几个问题:1、只能针对单通道电话语音进行检测。但是绝大多数电话录音系统都是进行双轨录音的,即录音文件中包含调查员与调查对象双方的语音。(所谓调查员,在本专利技术中是指电话满意度调查中主动发起电话调查的工作人员,其不作为身份冒充的检车对象;所谓调查对象,是指调查员调查的对象,也是身份冒充的检测对象。)2、处理语音的方式比较粗糙,直接对整段语音进行登记和识别,为精细化处理。电话调查语音中,可能存在噪音、回铃音、挂机音等多种非有效语音,也可能因未能完整分离单通道语音而存在调查员的声音。
技术实现思路
本专利技术提出一种在电话满意度调查中检测身份冒充的系统与方法,解决了以往电话满意度调查中身份冒充检测只能针对单通道电话语音进行检测且处理语音的方式比较粗糙,电话调查语音中存在噪音、回铃音等多种非有效语音等问题。为解决上述技术问题,本专利技术公开了一种在电话满意度调查中检测身份冒充的系统,该系统组成如下:一种在电话满意度调查中检测身份冒充的系统,包括:语音处理模块,用于对待检测语音库内的音频进行处理,包括去除待检测语音中的非有效语音;检验分析模块,用于对处理过的待检测语音库中的语音进行验证语音选取和声纹训练,从而通过声纹验证来检测身份冒充情况,对冒充检测结果进行统计分析;检测报告模块,用于将检验分析模块得到的结果生成检验报告。进一步的,所述语音处理模块包括预处理模块;预处理模块,用于对待检测语音进行分贝归一化、去“零漂”处理,去除待检测语音库中的非有效语音。更进一步的,所述语音处理模块还包括说话人语音分割模块;说话人语音分割模块,当待检测语音库为双通道语音时,该模块用来分离待检测语音中调查员和调查对象的语音,该模块的最终输出为调查对象语音库。进一步的,所述说话人语音分割模块包括调查员声纹库、说话人分割引擎和声纹识别引擎;调查员声纹库,为预先为调查员建立的声纹库;说话人分割引擎,用于对待检测语音库进行处理,生成调查员和调查对象语音库;声纹识别引擎,利用调查员声纹库,从调查员和调查对象语音库中选出调查对象语音库。进一步的,所述检验分析模块包括声纹训练模块、验证语音库选取模块、声纹验证模块以及得分统计分析模块;声纹训练模块,利用声纹识别技术,根据所述调查对象语音库训练得到调查对象声纹库;验证语音库选取模块,用于从调查对象语音库中选取用于进行声纹验证的语音库,生成调查对象验证语音库;声纹验证模块,利用声纹识别技术,根据调查对象验证语音库和调查对象声纹库,自动检测调查对象身份归属信息;得分统计分析模块,根据声纹验证模块的处理结果,分析待检测语音库中的身份冒充情况。进一步的,所述检测报告模块包括检测报告分析模块;检测报告分析模块,根据得分统计分析模块的输出,自动生成身份冒充检测报告。为解决上述技术问题,本专利技术公开了一种在电话满意度调查中检测身份冒充的方法,该方法包括:一种在电话满意度调查中检测身份冒充的方法,包括:步骤1、针对待检测语音库进行预处理,得到调查对象声纹库和调查对象验证语音库;步骤2、通过声纹验证模块进行身份冒充检测,然后通过得分统计分析模块对所得结果进行分析,检验出待检测语音库中的身份冒充情况;步骤3、由步骤2中得到的身份冒充情况生成检测报告。进一步的,所述步骤1针对待检测语音库进行处理进一步包括:步骤1.1、先对待检测语音进行分贝归一化、去“零漂”处理,然后去除待检测语音库中的非有效语音;步骤1.2、如果待检测语音为单通道语音,则跳过此步骤,直接进行下一步处理,同时将处理过的待检测语音库置为调查对象语音库;如果待检测语音为双通道语音,需对处理过的待检测语音库进行说话人语音分割处理,分割得到仅包含调查对象语音的语音库,并将其置为调查对象语音库;步骤1.3、根据调查对象语音库训练得到调查对象声纹库,同时从调查对象语音库中选取语音,以组成调查对象验证语音库。进一步的,所述步骤1.2中对处理过的待检测语音库进行说话人语音分割处理进一步还包括:步骤1.2.1、建立调查员声纹库;步骤1.2.2、利用说话人分割引擎将已处理的待检测语音库内的语音进行语音分割,得到调查员和调查对象语音库;步骤1.2.3、将步骤1.2.2中调查员和调查对象语音库与步骤1.2.1中调查员声纹库通过声纹识别引擎进行声纹识别,筛选出调查对象语音库。进一步的,所述步骤2对处理过的待检测语音库进行身份冒充检测进一步包括:步骤2.1、根据步骤1.3将生成的调查对象声纹库和调查对象验证语音库,用声纹验证模块对语音库进行身份冒充检测,得到相似度,再与预设的阈值比较,确认是接受用户还是拒绝用户,从而完成声纹验证过程;步骤2.2、将声纹验证模块的处理结果送入得分统计分析模块,得到冒充检测得分报表。由上述对本专利技术的描述可知,和现有技术相比,本文档来自技高网
...
一种在电话满意度调查中检测身份冒充的系统与方法

【技术保护点】
一种在电话满意度调查中检测身份冒充的系统,其特征在于,包括:语音处理模块,用于对待检测语音库内的音频进行处理,包括去除待检测语音中的非有效语音;检验分析模块,用于对处理过的待检验语音库中的语音进行验证语音选取和声纹训练,从而通过声纹验证来检测身份冒充情况,对冒充检测结果进行统计分析;检测报告模块,用于将检验分析模块得到的结果生成检验报告。

【技术特征摘要】
1.一种在电话满意度调查中检测身份冒充的系统,其特征在于,包括:语音处理模块,用于对待检测语音库内的音频进行处理,包括去除待检测语音中的非有效语音;检验分析模块,用于对处理过的待检测语音库中的语音进行验证语音选取和声纹训练,从而通过声纹验证来检测身份冒充情况,对冒充检测结果进行统计分析;检测报告模块,用于将检验分析模块得到的结果生成检验报告;所述语音处理模块包括预处理模块;预处理模块,用于对待检测语音进行分贝归一化、去“零漂”处理,去除待检测语音库中的非有效语音;所述检验分析模块包括声纹训练模块、验证语音库选取模块、声纹验证模块以及得分统计分析模块;声纹训练模块,利用声纹识别技术,根据所述调查对象语音库训练得到调查对象声纹库;根据说话人的语音提取说话人的身份信息,保存在声纹库中;验证语音库选取模块,用于从调查对象语音库中选取用于进行声纹验证的语音库,生成调查对象验证语音库;验证语音时长为1分钟;声纹验证模块,利用声纹识别技术,根据调查对象验证语音库和调查对象声纹库,自动检测调查对象身份归属信息;得分统计分析模块,根据声纹验证模块的处理结果,分析待检测语音库中的身份冒充情况;在得分统计分析模块中,设置一个高阈值H和一个低阈值L,与调查对象本人参考语音对其本人的声纹验证得分S一起,构成得分统计模块中的3个阈值;S=MAX{H,S},即在H和S之间取最大值;大于S的声纹验证得分对应的用户,被认为是冒充用户;大于H且小于S之间的声纹验证得分对应的用户,被认为是高可疑冒充用户;小于H且大于L的声纹验证得分对应的用户,被认为是可疑冒充用户;小于L的声纹验证得分对应的用户,被认为是非冒充用户。2.如权利要求1所述的一种在电话满意度调查中检测身份冒充的系统,其特征在于,所述语音处理模块还包括说话人语音分割模块;说话人语音分割模块,当待检测语音库为双通道语音时,该模块用来分离待检测语音中调查员和调查对象的语音,该模块的最终输出为调查对象语音库。3.如权利要求2所述的一种在电话满意度调查中检测身份冒充的系统,其特征在于,所述说话人语音分割模块包括调查员声纹库、说话人分割引擎和声纹识别引擎;调查员声纹库,为预先为调查员建立的声纹库;说话人分割引擎,用于对待检测语音库进行处理,生成调查员和调查对象语音库;声纹识别引擎,利用调查员声纹库,从调查员和调查对象语音库中选出调查对象语音库。4.如权利要求1或2中任一项所述的一种在电话满意度调查中检测身份冒充的系统,其特征在于,所述检测报告模块包括检测报告分析模块...

【专利技术属性】
技术研发人员:李稀敏肖龙源
申请(专利权)人:厦门快商通信息技术有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1