一种电话机器人语音拦截方法、装置及存储介质制造方法及图纸

技术编号:22888365 阅读:24 留言:0更新日期:2019-12-21 08:55
本发明专利技术公开了一种电话机器人语音拦截方法、装置及存储介质,其通过提取该历史通话的语音数据的音频指纹及指纹类型进行构建音频指纹库;将当前通话的语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配;若当前通话的音频指纹与音频指纹库中的机器指纹的相似度高于预设阈值时,则判定当前通话的语音数据为机器人语音;或者,若当前通话的音频指纹与音频指纹库中的其他指纹的相似度高于预设阈值时,且匹配的其他指纹的语音数量大于n,n≥1,则判定当前通话的语音数据为机器人语音;并自动对机器人语音进行拦截;无需识别来电号码,无需人工干预,能够自动识别电话机器人,算法简单有效,准确率高,能够有效识别机器人电话并进行拦截。

A voice interception method, device and storage medium for telephone robot

【技术实现步骤摘要】
一种电话机器人语音拦截方法、装置及存储介质
本专利技术涉及语音通信
,特别是一种电话机器人语音拦截方法及其应用该方法的装置和存储介质。
技术介绍
相比较传统的人工外呼作业,电话机器人的优势不言而喻,对于部分重复性较高的简单外呼工作,电话机器人已经可以实现自主作业,在一整系列电销工作中,电话机器人也能够辅助人工进行更高效率的外呼拓客。目前,电话机器人在政府和企事业单位的政务办公、灾情预警、广告营销等领域有着广泛的应用。然而随着语音电话业务的不断发展,骚扰电话和诈骗电话也随之增多,给人们的生活造成极大的困扰。比如,很多不良商家通过非法渠道获得大量个人信息,特别是获得通讯信息后,通常会通过电话机器人以语音电话方式进行广告宣传、诈骗或其他牟利活动。传统的骚扰电话拦截方法,通常是通过对主叫号码进行识别,如果识别到骚扰电话,则手机自动显示该号码为骚扰电话或高频电话,提示用户注意接听或直接挂断,或设置特有的铃声,对骚扰电话进行提示;除此之外,还采用下载第三方防骚扰软件的方法,自动隐藏与处理骚扰电话。但是,电话机器人通常都是基于合成音(根据具体需求合成内容语音)或录音(将可能的语句录下来,根据需求播放),还经常变换号码或采用虚拟号码,使得传统的骚扰电话拦截方法几近失效,对人们的工作效率和心情影响极大。如何规范语音电话业务,有效防控骚扰电话和诈骗电话已成为当前需要重点研究解决的问题。
技术实现思路
本专利技术为解决上述问题,提供了一种电话机器人语音拦截方法、装置及存储介质,无需识别来电号码,而是结合机器人电话的特点,实现一种无监督的机器人语音拦截技术,能够有效识别机器人电话并进行拦截。为实现上述目的,本专利技术采用的技术方案为:一种电话机器人语音拦截方法,其包括以下步骤:获取历史通话的语音数据,提取该历史通话的语音数据的音频指纹,并对该音频指纹进行分类为机器指纹和其他指纹,根据所述音频指纹及指纹类型进行构建音频指纹库;获取当前通话的语音数据,并提取该当前通话的语音数据的音频指纹;将所述语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配;若匹配结果满足以下两个条件的其中之任一条件,则认为当前通话的语音数据为机器人语音:a.若当前通话的音频指纹与所述音频指纹库中的机器指纹的相似度高于预设阈值时,则判定当前通话的语音数据为机器人语音;b.若当前通话的音频指纹与所述音频指纹库中的其他指纹的相似度高于预设阈值时,且匹配的其他指纹的语音数量大于n,n≥1,则判定当前通话的语音数据为机器人语音;并且,将所述音频指纹库中匹配的其他指纹标注为机器指纹,并将所述音频指纹库中匹配的其他指纹对应的语音数据标注为机器人语音;若当前通话的语音数据判定为机器人语音,则自动对当前通话进行拦截。优选的,所述的音频指纹库中,所述机器人语音包括录制语音和合成语音。优选的,获取当前通话的语音数据,包括:监听电话接通时间,并获取设定时长内的语音数据;对所述语音数据进行分帧处理,并通过静音检测去除所述语音数据的静音帧,得到有效帧;根据能量算法确定所述各有效帧中的关键帧;提取所述关键帧的音频指纹。优选的,将所述语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配,进一步包括以下匹配步骤:从所述音频指纹库中提取任一音频指纹,确定所述任一音频指纹与所述当前通话的语音数据的音频指纹的相似度;若所述相似度小于设定相似度阈值,提取所述任一音频指纹的下一音频指纹,并判断该下一音频指纹与所述当前通话的语音数据的音频指纹的相似度,如此循环。进一步的,所述音频指纹的相似度,是通过对所述当前通话的语音数据的音频指纹和所述音频指纹库中的音频指纹分别建立对应的音频指纹哈希表,根据所述音频指纹哈希表计算两个所述音频指纹的相似度。优选的,所述当前通话的语音数据进一步包括拨打方语音和接收方语音,通过预先存储接收方语音的音频指纹,并根据该接收方语音的音频指纹对所述接收方语音进行识别和分割,得到所述拨打方语音,并对所述拨打方语音进行音频指纹的提取和匹配。进一步的,所述拨打方语音和所述音频指纹库中的机器人语音中,所述音频指纹的提取是指提取语音的物理特征;所述接收方语音中,所述音频指纹的提取是指提取语音的物理特征和感知特征;所述物理特征包括语音的短时能量、过零率、谱峰、谱密度;所述感知特征包括语音的音高、音调、旋律和节奏。优选的,还包括:对所述音频指纹库的更新步骤:若未匹配到相似的音频指纹,则将当前通话的语音数据及其对应的音频指纹存入缓存数据库中,再通过对所述缓存数据库中的语音数据及对应的音频指纹进行分析和分类;或者,若未匹配到相似的音频指纹,则直接将当前通话的语音数据及其对应的音频指纹存入所述音频指纹库中进行分析和分类;以及对所述音频指纹库进行定期清理的步骤:当所述音频指纹库中的机器指纹未再次匹配的时间大于预设的M值时,则将该机器指纹从所述音频指纹库中清除;当所述音频指纹库中的其他指纹未再次匹配的时间大于预设的N值时,则将该其他指纹从所述音频指纹库中清除。与所述方法相对应的,本专利技术还提供一种电话机器人语音拦截装置,其包括存储器和处理器,所述存储器中存储有指令,所述处理器通过执行所述存储器中存储的指令使得电话机器人语音拦截装置实现如上述任一项所述的电话机器人语音拦截方法。与所述方法相对应的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,电话机器人语音拦截装置执行所示指令使得电话机器人语音拦截装置实现上述任一项所述的电话机器人语音拦截方法。本专利技术的有益效果是:(1)本专利技术通过将来电语音与数据库中的电话机器人语音进行音频指纹的匹配,从而判断来电的拨打方是否为电话机器人,无需识别来电号码,而是结合机器人电话的特点,实现一种无监督的机器人语音拦截技术,能够有效识别机器人电话并进行拦截;(2)本专利技术无需人工干预,能够自动识别电话机器人,算法简单有效,准确率高;(3)本专利技术通过对来电的语音数据进行预处理,仅对其中的关键帧进行音频指纹的提取和匹配,计算量更小且准确率更高;(4)本专利技术对来电的语音数据进行预处理,还包括对接收方语音进行识别和分割,仅对拨打方语音进行识别和匹配,不仅计算量更小,而且避免误判,准确率更高;(5)本专利技术还定期对未匹配到相似音频指纹进行清理,使得音频指纹库的识别能力越来越完善。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合具体实施例对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本专利技术的一种电话机器人语音拦截方法,其包括以下步骤:获取历史通话的语音数据,提取该历史通话的语音数据的音频指纹,并对该音频指纹进行分类为机器指纹和其他指纹,根据所述音频指纹及指纹类型进行构建音频指纹库;本文档来自技高网...

【技术保护点】
1.一种电话机器人语音拦截方法,其特征在于,包括以下步骤:/n获取历史通话的语音数据,提取该历史通话的语音数据的音频指纹,并对该音频指纹进行分类为机器指纹和其他指纹,根据所述音频指纹及指纹类型进行构建音频指纹库;/n获取当前通话的语音数据,并提取该当前通话的语音数据的音频指纹;/n将所述语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配;若匹配结果满足以下两个条件的其中之任一条件,则认为当前通话的语音数据为机器人语音:/na.若当前通话的音频指纹与所述音频指纹库中的机器指纹的相似度高于预设阈值时,则判定当前通话的语音数据为机器人语音;/nb.若当前通话的音频指纹与所述音频指纹库中的其他指纹的相似度高于预设阈值时,且匹配的其他指纹的语音数量大于n,n≥1,则判定当前通话的语音数据为机器人语音;并且,将所述音频指纹库中匹配的其他指纹标注为机器指纹,并将所述音频指纹库中匹配的其他指纹对应的语音数据标注为机器人语音;/n若当前通话的语音数据判定为机器人语音,则自动对当前通话进行拦截。/n

【技术特征摘要】
1.一种电话机器人语音拦截方法,其特征在于,包括以下步骤:
获取历史通话的语音数据,提取该历史通话的语音数据的音频指纹,并对该音频指纹进行分类为机器指纹和其他指纹,根据所述音频指纹及指纹类型进行构建音频指纹库;
获取当前通话的语音数据,并提取该当前通话的语音数据的音频指纹;
将所述语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配;若匹配结果满足以下两个条件的其中之任一条件,则认为当前通话的语音数据为机器人语音:
a.若当前通话的音频指纹与所述音频指纹库中的机器指纹的相似度高于预设阈值时,则判定当前通话的语音数据为机器人语音;
b.若当前通话的音频指纹与所述音频指纹库中的其他指纹的相似度高于预设阈值时,且匹配的其他指纹的语音数量大于n,n≥1,则判定当前通话的语音数据为机器人语音;并且,将所述音频指纹库中匹配的其他指纹标注为机器指纹,并将所述音频指纹库中匹配的其他指纹对应的语音数据标注为机器人语音;
若当前通话的语音数据判定为机器人语音,则自动对当前通话进行拦截。


2.根据权利要求1所述的一种电话机器人语音拦截方法,其特征在于:所述机器人语音包括录制语音和合成语音。


3.根据权利要求1所述的一种电话机器人语音拦截方法,其特征在于:获取当前通话的语音数据,包括:
监听电话接通时间,并获取设定时长内的语音数据;
对所述语音数据进行分帧处理,并通过静音检测去除所述语音数据的静音帧,得到有效帧;
根据能量算法确定所述各有效帧中的关键帧;
提取所述关键帧的音频指纹。


4.根据权利要求1所述的一种电话机器人语音拦截方法,其特征在于:将所述语音数据的音频指纹与所述音频指纹库中的音频指纹进行匹配,进一步包括以下匹配步骤:
从所述音频指纹库中提取任一音频指纹,确定所述任一音频指纹与所述当前通话的语音数据的音频指纹的相似度;
若所述相似度小于设定相似度阈值,提取所述任一音频指纹的下一音频指纹,并判断该下一音频指纹与所述当前通话的语音数据的音频指纹的相似度,如此循环。


5.根据权利要求4所述的一种电话机器人语音拦截方法,其特征在于:所述音频指纹...

【专利技术属性】
技术研发人员:洪国强肖龙源李稀敏蔡振华刘晓葳王静
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1