An echo detection method, a storage medium and an electronic device are disclosed. The embodiment of the present invention obtains the first party's track data and the second party's track data recorded in the process of real-time communication, obtains at least one reference voice segment from one of them, calculates the similarity coefficient between the reference voice segment and the second party's track data, and classifies them according to the similarity coefficient. Therefore, the echo of the first party can be detected and classified quickly in the second party's track data. Thus, echo detection can be performed quickly.
【技术实现步骤摘要】
回音检测方法、存储介质和电子设备
本专利技术涉及信号处理技术,具体涉及一种回音检测方法、存储介质和电子设备。
技术介绍
随着互联网技术的不断发展,基于网络连接的在线音频、视频通信得到越来越广泛的应用。在在线音视频通信的场景下,第一方的音频数据会经由网络传输到第二方的终端设备,并通过终端设备的扬声器播放。同时,第二方的终端会通过麦克风持续地进行音频采集。在这种情况下,由扬声器播放的声音也会被麦克风采集,并传输回第一方的终端设备,形成回音。另一方面,第二方的终端设备的扬声器的电信号也可能对采集的音频信号构成干扰,并形成回音。现有技术通常会对双方传输的音频信号进行回音消除处理,以在实时通信的场景下消除回音。但是,回音消除处理的效果如何,无法进行快速检测和评估。
技术实现思路
有鉴于此,本专利技术实施例提出一种回音检测方法、存储介质和电子设备,以对录制的音频数据进行回音(也即,回声)检测判断,为改进回音抑制算法和快速进行效果评估提供数据支持。根据本专利技术实施例的第一方面,提供一种回音检测方法,其中,所述方法包括:获取第一音频数据和第二音频数据,所述第一音频数据和所述第二音频数据分别对应于通过网络进行音频对话第一方的音轨数据和第二方的音轨数据;在所述第一音频数据中截取至少一个音频数据片段作为参考语音片段;对于每个参考语音片段,根据所述参考语音片段的时间戳从所述第二音频数据中截取多个具有不同时间偏移量的检测语音片段;对于每个参考语音片段,计算所述参考语音片段与对应的各检测语音片段的相似度系数;根据所述相似度系数对第二音频数据进行回音检测分类。根据本专利技术实施例的第二方 ...
【技术保护点】
1.一种回音检测方法,其特征在于,所述方法包括:获取第一音频数据和第二音频数据,所述第一音频数据和所述第二音频数据分别对应于通过网络进行音频对话第一方的音轨数据和第二方的音轨数据;在所述第一音频数据中截取至少一个音频数据片段作为参考语音片段;对于每个参考语音片段,根据所述参考语音片段的时间戳从所述第二音频数据中截取多个具有不同时间轴偏移量的检测语音片段;对于每个参考语音片段,计算所述参考语音片段与对应的各检测语音片段的相似度系数;根据所述相似度系数对第二音频数据进行回音检测分类。
【技术特征摘要】
1.一种回音检测方法,其特征在于,所述方法包括:获取第一音频数据和第二音频数据,所述第一音频数据和所述第二音频数据分别对应于通过网络进行音频对话第一方的音轨数据和第二方的音轨数据;在所述第一音频数据中截取至少一个音频数据片段作为参考语音片段;对于每个参考语音片段,根据所述参考语音片段的时间戳从所述第二音频数据中截取多个具有不同时间轴偏移量的检测语音片段;对于每个参考语音片段,计算所述参考语音片段与对应的各检测语音片段的相似度系数;根据所述相似度系数对第二音频数据进行回音检测分类。2.根据权利要求1所述的方法,其特征在于,所述在所述第一音频数据中截取至少一个音频数据片段作为参考语音片段包括:去除第一音频数据中无语音信号的部分,获取包含连续的语音信息的多个音频数据片段;选取满足预定条件的至少一个音频数据片段作为所述参考语音片段。3.根据权利要求2所述的方法,其特征在于,所述选取满足预定条件的至少一个音频数据片段作为所述参考语音片段包括:计算每个音频数据片段的信号功率;选取信号功率最大的至少一个音频数据片段作为所述参考语音片段。4.根据权利要求1所述的方法,其特征在于,所述检测语音片段的时间长度与所述参考语音片段的时间长度相同。5.根据权利要求1所述的方法,其特征在于,所述根据所述相似度系数对第二音频数据进...
【专利技术属性】
技术研发人员:王正博,沈亮,
申请(专利权)人:北京大米科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。