音频信号、图像处理的方法、装置和系统制造方法及图纸

技术编号：17518232 阅读：33 留言：0更新日期：2018-03-21 02:40

本发明专利技术提供了一种音频信号、图像处理的方法、装置和系统，通过本发明专利技术根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置；根据第二预设算法对待检测对象的历史位置进行滤波后计算，得到待检测对象的第二预测位置；结合第一预测位置和第二预测位置依据音频信号在时间上的连续性进行校正，得到待检测对象当前所在的位置，解决由于缺少对发言者的位置跟踪技术，导致在远程视频会议系统中无法及时显示发言者的位置以及跟踪获取发言者多媒体信息的问题，达到及时获取发言者的位置以及跟踪获取发言者多媒体信息效果。

Audio signal, method, device and system for image processing

The present invention provides an audio signal and image processing method, device and system of the invention, according to the first preset algorithm is calculated on the basis of a number of Mike acquisition of the audio signal, get the first predicted position of an object to be detected; according to the calculation of filter algorithm to detect object second preset historical position, get the object to be detected the second predicted position; combined with the first position and the second position on the basis of prediction prediction of audio signal in time continuity correction, get the current location of the object to be detected and resolved due to the lack of the location of the speaker tracking technology, to display the location of the speaker and get timely tracking information in multimedia speakers can remote video conferencing system in the speaker's position and timely access to multimedia information acquisition speaker tracking The effect of interest.

全部详细技术资料下载

【技术实现步骤摘要】
音频信号、图像处理的方法、装置和系统
本专利技术涉及语音识别技术应用领域，具体而言，涉及一种音频信号、图像处理的方法、装置和系统。
技术介绍
随着视频通信技术的快速发展，远程会议电视业务日益兴起。在远程视频会议系统的使用过程中，如何依据发言人的声音通过设备进行定位并展示出来，成为了现在远程视频会议系统中待解决的问题。针对相关技术中由于缺少对发言者的位置跟踪技术，导致在远程视频会议系统中无法及时显示发言者的位置以及跟踪获取发言者多媒体信息的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种音频信号、图像处理的方法、装置和系统，以至少解决相关技术中由于缺少对发言者的位置跟踪技术，导致在远程视频会议系统中无法及时显示发言者的位置以及跟踪获取发言者多媒体信息的问题。根据本专利技术的一个实施例，提供了一种音频信号处理的方法，包括：根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置；根据第二预设算法对待检测对象的历史位置进行滤波后计算，得到待检测对象的第二预测位置；结合第一预测位置和第二预测位置依据音频信号在时间上的连续性进行校正，得到待检测对象当前所在的位置。可选的，根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置包括：将多个麦克进行分类，分为第一麦克阵列和第二麦克阵列；依据第一预设算法计算待检测对象与第一麦克阵列之间的第一夹角，以及依据第一预设算法计算待检测对象与第二麦克阵列之间的第二夹角；依据预设三角函数，通过第一夹角和第二夹角，计算得到待检测对象的第一预测位置。进一步地，可选的...
音频信号、图像处理的方法、装置和系统

【技术保护点】
一种音频信号处理的方法，其特征在于，包括：根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置；根据第二预设算法对所述待检测对象的历史位置进行滤波后计算，得到所述待检测对象的第二预测位置；结合所述第一预测位置和所述第二预测位置依据所述音频信号在时间上的连续性进行校正，得到所述待检测对象当前所在的位置。

【技术特征摘要】
1.一种音频信号处理的方法，其特征在于，包括：根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置；根据第二预设算法对所述待检测对象的历史位置进行滤波后计算，得到所述待检测对象的第二预测位置；结合所述第一预测位置和所述第二预测位置依据所述音频信号在时间上的连续性进行校正，得到所述待检测对象当前所在的位置。2.根据权利要求1所述的方法，其特征在于，所述根据第一预设算法依据多个麦克采集的音频信号进行计算，得到待检测对象的第一预测位置包括：将所述多个麦克进行分类，分为第一麦克阵列和第二麦克阵列；依据所述第一预设算法计算所述待检测对象与所述第一麦克阵列之间的第一夹角，以及依据所述第一预设算法计算所述待检测对象与所述第二麦克阵列之间的第二夹角；依据预设三角函数，通过所述第一夹角和所述第二夹角，计算得到所述待检测对象的第一预测位置。3.根据权利要求2所述的方法，其特征在于，所述依据所述第一预设算法计算所述待检测对象与所述第一麦克阵列之间的第一夹角包括：在所述第一预设算法为到达时间差算法TDOA的情况下，计算所述第一麦克阵列中各个麦克采集的音频信号之间的欧式距离；依据每个麦克采集的音频信号之间的所述欧式距离与所述第一夹角的关系进行计算，得到所述第一夹角的估计值集合；计算所述第一夹角的估计值集合的均值，并将所述均值确定为所述第一夹角。4.根据权利要求2所述的方法，其特征在于，所述依据所述第一预设算法计算所述待检测对象与所述第二麦克阵列之间的第二夹角包括：在所述第一预设算法为到达时间差算法TDOA的情况下，计算所述第二麦克阵列中各个麦克采集的音频信号之间的欧式距离；依据每个麦克采集的音频信号之间的所述欧式距离与所述第二夹角的关系进行计算，得到所述第二夹角的估计值集合；计算所述第二夹角的估计值集合的均值，并将所述均值确定为所述第二夹角。5.根据权利要求2所述的方法，其特征在于，所述根据第二预设算法对所述待检测对象的历史位置进行滤波后计算，得到所述待检测对象的第二预测位置包括：通过所述第一预设算法分别计算所述第一麦克阵列的第一预测角度的第一估计值集合，以及所述第二麦克阵列的第二预测角度的第二估计值集合；在所述第二预设算法为卡尔曼滤波算法的情况下，通过所述卡尔曼滤波算法分别判断所述第一估计值集合和所述第二估计值集合是否满足预设条件；依据判断结果确定所述第一夹角和所述第二夹角；依据预设三角函数，通过所述第一夹角和所述第二夹角进行计算，得到上述待检测对象的第二预测位置。6.根据权利要求5所述的方法，其特征在于，在得到所述待检测对象当前所在的位置之后，所述方法还包括：依据所述待检测对象当前所在的位置，更新卡尔曼滤波器参数。7.根据权利要求1至6中任一项所述的方法...

【专利技术属性】
技术研发人员：任志平，
申请(专利权)人：南京中兴新软件有限责任公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人