用于从混合音频记录选择性去除音频内容的系统和方法技术方案

技术编号：11975715 阅读：158 留言：0更新日期：2015-08-31 01:48

提供用于从音频记录(例如，嵌入在媒体文件中的音频记录)去除声音记录的系统和技术。系统可以包括识别组件、第一减法组件和第二减法组件。识别组件识别混合音频记录中的声音记录。第一减法组件确定声音记录的局部线性变换，并且从混合音频记录减去声音记录的局部线性变换，以生成新的混合音频记录。第二减法组件将声音记录的一个或多个片段与新的混合音频记录的一个或多个相应片段进行比较，并且至少部分地基于一个或多个相应片段与一个或多个片段的关联来减小新的混合音频记录的功率水平。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于从混合音频记录选择性去除音频内容的系统和方法相关申请的交叉引用本申请要求于2012年6月18日提交的名为“SYSTEMANDMETHODFORSELECTIVEREMOVALOFAUDIOCONTENTFROMAMIXEDAUDIORECORDING”的美国临时申请No.61/661,225和于2012年12月28日提交的名为“SYSTEMANDMETHODFORSELECTIVEREMOVALOFAUDIOCONTENTFROMAMIXEDAUDIORECORDING”的美国非临时申请No.13/730,076的益处，其每一个的全部结合于此作为参考。
本公开总体涉及音频处理，并且更具体地涉及从混合音频记录选择性地去除音频内容。
技术介绍
经常地，音频记录(例如，音频文件)包括多个声音记录。例如，音频记录可以是作为声学捕捉(例如，麦克风)或音频混合(例如，将多个声音记录混合为单个音频记录的音频过程)的结果的混合音频记录。在一个示例中，混合音频记录可以包括与所记录的歌曲交织的语音(例如，来自一些人说话的音频)。然而，在特定情形下，期望从音频记录去除一个或多个声音记录(例如，记录的歌曲)。
技术实现思路
以下提供说明书的简化概要，以提供说明书的一些方面的基本理解。本概要不是说明书的广泛概述。其既不旨在识别说明书的关键或重要元素，也不旨在描绘说明书的特定实现的任何范围或者权利要求的任何范围。其唯一目的在于以简化形式呈现说明书的一些概念，作为随后呈现的更详细说明的前奏。根据一个实现，一种系统包括识别组件、第一减法组件和第二减法组件。识别组件识别混合音频记录中的声音...
用于从混合音频记录选择性去除音频内容的系统和方法

【技术保护点】
一种系统，包括：存储器，所述存储器存储计算机可执行组件；以及处理器，所述处理器被配置成执行存储在所述存储器中的以下计算机可执行组件：识别组件，所述识别组件识别混合音频记录中的声音记录；第一减法组件，所述第一减法组件确定所述声音记录的局部线性变换，并且从所述混合音频记录减去所述声音记录的所述局部线性变换，以生成新的混合音频记录；以及第二减法组件，所述第二减法组件将所述声音记录的一个或多个片段与所述新的混合音频记录的一个或多个相应片段进行比较，并且至少部分地基于所述一个或多个相应片段与所述一个或多个片段的关联来减小所述新的混合音频记录的功率水平。

【技术特征摘要】
【国外来华专利技术】2012.06.18 US 61/661,225;2012.12.28 US 13/730,0761.一种系统，包括：处理器；通信地耦合到所述处理器的存储器，所述存储器具有存储于其中的计算机可执行指令，包括：识别组件，所述识别组件被配置成从多个参考声音记录中识别与部分的混合音频记录相匹配的参考声音记录；第一减法组件，所述第一减法组件被配置成确定所述参考声音记录的局部线性变换，以将近似于所述部分的所述混合音频记录的所述参考声音记录进行变换，并且从所述部分的所述混合音频记录减去所述参考声音记录的所述局部线性变换以生成新的混合音频记录；以及第二减法组件，所述第二减法组件被配置成将所述部分的所述混合音频记录的一个或多个片段与所述新的混合音频记录的一个或多个相应片段进行比较，并且至少部分地基于所述一个或多个相应片段中的至少一个片段与所述部分的混合音频记录的所述一个或多个片段中的至少一个片段的谱相关，来减小所述新的混合音频记录中所述一个或多个相应片段中所述至少一个片段的功率水平。2.根据权利要求1所述的系统，其中，所述识别组件进一步被配置成识别所述部分的所述混合音频记录的开始时间和结束时间。3.根据权利要求1所述的系统，其中，所述一个或多个片段和所述一个或多个相应片段是基于所述参考声音记录和所述混合音频记录的各自光谱图。4.根据权利要求1所述的系统，其中，所述局部线性变换对所述参考声音记录实施矩阵运算。5.根据权利要求1所述的系统，其中，响应于确定所述一个或多个相应片段中的特定片段中的剩余声音低于预定阈值水平，通过所述第二减法组件将所述特定片段的功率水平减小到零。6.根据权利要求1所述的系统，其中，所述第二减法组件被进一步配置成将所述部分的所述混合音频记录的所述一个或多个片段的各自幅度与所述新的混合音频记录的所述一个或多个相应片段的各自的相应幅度进行比较。7.根据权利要求1所述的系统，其中，所述第二减法组件被进一步配置成使用短时傅里叶变换算法来将所述部分的所述混合音频记录的所述一个或多个片段与所述新的混合音频记录的所述一个或多个相应片段进行比较。8.根据权利要求1所述的系统，其中，所述第一减法组件被进一步配置成从多个局部线性变换中选择产生与所述部分的所述混合音频记录最接近匹配的所述局部线性变换。9.根据权利要求1所述的系统，其中，所述混合音频记录被嵌入在视频文件中。10.根据权利要求9所述的系统，其中，所述视频文件被存储在远程服务器上。11.根据权利要求1所述的系统，其中，所述第一减法组件被进一步配置成实现互相关，以使所述参考声音记录与所述部分的所述混合音频记录在时间上对准。12.根据权利要求1所述的系统，其中，所述第一减法组件被进一步配置成使用自适应过滤来确定用于所述声音记录的所述局部线性变换。13.根据权利要求6所述的系统，其中，所述第二减法组件被进一步配置成，基于所述部分的所述混合音频记录的所述一个或多个片段的各自幅度与所述新的混合音频记录的所述一个或多个相应片段的各自相应幅度的比较，从所述新的混合音频记录的至少一个对数幅度谱片段中减去所述部分的所述混合音频的至少一个对数幅度谱片段。14.根据...

【专利技术属性】
技术研发人员：克里斯托弗·拉罗萨，萨姆·克瓦伦，托马斯·查德威克·沃尔特斯，理查德·弗朗西斯·莱恩，罗伯特·史蒂文·格利克斯坦，鲁沙巴·阿肖克·多希，莫莉·卡斯尔·尼克斯，杰森·马修·托夫，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人