本发明专利技术实施例涉及数据处理技术领域,公开了一种双讲检测方法及电子设备。本发明专利技术实施例中,双讲检测方法,包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。本发明专利技术实施例适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。
【技术实现步骤摘要】
双讲检测方法及电子设备
本专利技术实施例涉及数据处理
,特别涉及一种双讲检测方法及电子设备。
技术介绍
在因特网上进行语音的实时传输已经应用广泛,影响因特网语音质量的关键的因素之一是回声的影响,因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行回声处理。其中,检测回声消除算法的一个关键指标是双讲检测的准确率,如果在回声消除算法中双讲检测不准,那么就会出现语音断续、沟通不畅等情况,这将大大降低语音通话质量;因此,在回声消除处理中,双讲检测对于语音质量至关重要。目前,双讲检测大多是基于传统时/频域计算来实现的,即通过远端语音与近端语音的互相关系数、频谱计算等思想来进行双讲检测计算的。然而,专利技术人发现现有技术中至少存在如下问题:由于网络电话(VOIP)语音通信中,回声产生的原因比较复杂,具有回声源复杂,回声路径延迟大,通话场景多变,通话设备类型多变等特点,而传统的双讲检测算法迭代的因子和采用的参数基本是固定的,因此具有局限性,无法随着说话语境/场景的变换进行有效的调整。
技术实现思路
本专利技术实施方式的目的在于提供一种双讲检测方法及电子设备,使得适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。为解决上述技术问题,本专利技术的实施方式提供了一种双讲检测方法,包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。本专利技术的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的双讲检测方法。本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的双讲检测方法。本专利技术实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本专利技术实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本专利技术实施例适用于各种语音通话环境,大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高了语音质量。另外,对初始语音信号进行预设信号处理得到语音处理信号,包括:对所述初始语音信号进行预处理得到第一语音处理信号;对所述第一语音处理信号进行时频转换得到第二语音处理信号;本实施例中,提供了对初始语音信号的一种预设信号处理方式。另外,对所述初始语音信号进行预处理得到第一语音处理信号,包括:对所述初始语音信号进行分帧、加窗以及去直流操作得到所述第一语音处理信号。本实施例中,提供了预处理的一种具体实现方式。另外,所述预设的双讲检测模型的生成方法包括:从设备的回声模块中获取初始语音信号;对所述初始语音信号进行预设信号处理得到语音处理信号;从所述语音处理信号中提取特征参数;根据预设双讲检测方法搭建深度学习双讲检测模型;将所述特征参数输入所述深度学习双讲检测模型进行训练以得到经训练后所述深度学习双讲检测模型。本实施例中,提供了双讲检测模型的一种具体生成方法。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。图1是根据第一实施方式的双讲检测方法的具体流程图;图2是根据第二实施方式的双讲检测方法的具体流程图;图3是根据第三实施方式的双讲检测方法的具体流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。本专利技术的第一实施方式涉及一种双讲检测方法,如图1所示,双讲检测方法包括:步骤101,从设备的回声模块中获取初始语音信号。本实施方式中,初始语音信号包括近端语音信号与远端语音信号。例如A用户与B用户语音通话,从A用户的移动终端的角度来讲,A用户发出的语音信号即为近端语音信号,B用户发出的语音信号即为远端语音信号。在一个例子中,电子设备以手机为例,当检测到A用户与B用户在即时通信类的应用程序例如微信上进行语音通话,那么A用户的手机就从微信的回声模块中获取A用户与B用户之间通话的语音信号,即为初始语音信号;然这里只是示例性说明,实际中不限于此。步骤102,对初始语音信号进行预设信号处理得到语音处理信号。步骤103,从语音处理信号中提取预设的特征参数。本实施方式中,预设的特征参数至少包括近端语音信号与远端语音信号的互相关系数、远端语音的语音活动检测值、近端语音信号和线性回声处理后的回声残留信号的互相关系数;然实际中不限于此,本实施例对特征参数的类型不作任何限制。步骤104,将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。在一个例子中,双讲检测结果可以为表征单通或双通的双讲检测标志。例如当检测出来为单通时,以预先设定的表征单通的双讲检测标志0表示;当检测出来为双通时,以预先设定的表征双通的双讲检测标志1表示;然这里只是示例性说明,本实施例对双讲检测标志的类型不作任何限制。本专利技术的实施例相对于现有技术而言,本专利技术实施方式相对于现有技术而言,提供了一种双讲检测方法,该方法包括从设备的回声模块中获取初始语音信号;对初始语音信号进行预设信号处理得到语音处理信号;从语音处理信号中提取特征参数;将特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果;即本专利技术实施例采用机器学习的方式预先搭建深度学习双讲检测模型,对不同通话场景下的双讲检测进行学习训练,从而很好的解决了传统双讲检测算法对于不同通话场景的局限性问题,本专利技术实施例适用于各种语音通话环境,可大大提高双讲检测的准确性,从而提高回声消除算法的性能,提高语音质量。上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。本专利技术的第二实施方式涉及一种双讲检测方法。第二实施方式在第一实施方式的基础上进行改进,主要改进之处本文档来自技高网...
【技术保护点】
1.一种双讲检测方法,其特征在于,包括:/n从设备的回声模块中获取初始语音信号;/n对所述初始语音信号进行预设信号处理得到语音处理信号;/n从所述语音处理信号中预设的特征参数;/n将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。/n
【技术特征摘要】
1.一种双讲检测方法,其特征在于,包括:
从设备的回声模块中获取初始语音信号;
对所述初始语音信号进行预设信号处理得到语音处理信号;
从所述语音处理信号中预设的特征参数;
将所述特征参数输入预设的深度学习双讲检测模型并得到双讲检测结果。
2.根据权利要求1所述的双讲检测方法,其特征在于,所述对所述初始语音信号进行预设信号处理得到语音处理信号,包括:
对所述初始语音信号进行预处理得到第一语音处理信号;
对所述第一语音处理信号进行时频转换得到第二语音处理信号。
3.根据权利要求2所述的双讲检测方法,其特征在于,所述对所述初始语音信号进行预处理得到第一语音处理信号,包括:
对所述初始语音信号进行分帧、加窗以及去直流操作得到所述第一语音处理信号。
4.根据权利要求2所述的双讲检测方法,其特征在于,所述对所述第一语音处理信号进行时频转换得到第二语音处理信号,为:
对所述第一语音处理信号通过傅里叶变换进行时频转换得到第二语音处理信号。
5.根据权利要求1所述的双讲检测方法,其特征在于,所述初始语音信号包括近端语音信号和远端语音信号;所述特征参数至少包括近端语音信号与远...
【专利技术属性】
技术研发人员:宋钦梅,方华,屈跃强,周骏华,程宝平,
申请(专利权)人:中移杭州信息技术有限公司,中国移动通信集团有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。