【技术实现步骤摘要】
【国外来华专利技术】真实世界音频训练数据的自动挖掘
[0001]在机器学习领域中,必须获取用于训练机器学习模型的干净且正确标记的数据来训练模型。日期的收集和监管通常涉及评估者,他们听取以各种方式收集的数据并标记数据。因此,收集此种音频训练数据通常是非常劳动密集型的,容易产生各种偏见并且存在隐私风险。
技术实现思路
[0002]本说明书涉及收集音频数据,以用于训练机器学习模型来辨识音频数据中的特征。下面描述的系统和方法有助于以设备上(on
‑
device)的方式自动地标记真实世界音频数据,而无需将它们从设备转移出来供人类评估者审查。这样会降低私人数据泄露风险的可能性。然后,标记的数据可以在设备上用于设备上联邦学习(Federated Leaming)(在这种情况下,天可以从未需要离开设备)或传递到云,其中数据可以用于对模型进行服务器端训练(在这种情况下,避免不需要的隐私风险和人类评估者的金钱成本)。
[0003]一般来说,本说明书中描述的主题的一个创新方面可以体现方法中,所述方法包括由包括多个麦克风的用户设备接收音频记录集合的动作,其中对 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:由包括多个麦克风的用户设备接收音频记录的集合,其中对于每个音频记录的集合,所述集合中的每个音频记录是在特定时间间隔期间通过所述用户设备中的所述多个麦克风中的相应的单独麦克风来记录的,并且每个特定时间间隔对于每个音频记录的集合是不同的;对于每个音频记录的集合,由检测器确定所述音频记录的集合中的音频记录是否包括特定音频特征以及所述音频记录中的另一音频记录是否不包括所述特定音频特征;对于被确定为包括含有所述特定音频特征的音频记录和包括不含有所述特定音频特征的另一音频记录的每个音频记录的集合,生成标记训练样本,所述标记训练样本包括:(i)被确定为不包括所述特定音频特征的所述音频记录的至少一部分,以及(ii)指示存在所述特定音频特征的标记。2.根据权利要求1所述的计算机实现的方法,还包括:使用所生成的标记训练样本来训练机器学习模型。3.根据权利要求1所述的计算机实现的方法,其中,所述检测器是在所述用户设备上执行的经机器学习的模型。4.根据权利要求1所述的计算机实现的方法,其中,生成标记训练样本、所述标记训练样本包括(i)被确定为不包括所述特定音频特征的所述音频记录的至少所述一部分以及(ii)指示存在所述特定音频特征的所述标记包括:生成所述标记训练样本,使得所述标记训练样本包括:(i)被确定为不包括所述特定音频特征的每个音频记录的一部分,以及(ii)指示存在所述特定音频特征的所述标记。5.根据权利要求1所述的计算机实现的方法,其中,生成标记训练样本、所述标记训练样本包括(i)被确定为不包括所述特定特征的所述音频记录的至少所述一部分以及(ii)指示存在所述特定特征的所述标记包括:生成所述标记训练样本,使得所述标记训练样本包括:(i)在所述音频记录的集合中的所有音频记录的一部分,以及(ii)指示存在所述特定音频特征的所述标记。6.根据权利要求1所述的计算机实现的方法,其中,生成标记训练样本、所述标记训练样本包括(i)被确定为不包括所述特定音频特征的所述音频记录的至少所述一部分以及(ii)指示存在所述特定音频特征的所述标记包括:从被确定为不包括所述特定音频特征的所述音频记录的所述一部分中选择与被确定为包括所述特定音频特征并且从中确定所述特定音频特征存在于所述音频记录中的所述音频记录的子部分在时间上一致的所述音频记录的子部分;以及将所选择的子部分用作所述音频记录的所述一部分。7.根据权利要求1所述的计算机实现的方法,其中,由所述检测器确定所述音频记录的集合中的音频记录是否包括特定音频特征以及所述音频记录中的另一音频记录是否不包括所述特定音频特征包括:确定来自第一麦克风的音频记录是否包括所述特定音频特征;当来自所述第一麦克风的音频记录被确定为包括所述特定音频特征时,确定来自其它麦克风中的一个或多个麦克风的音频记录是否包括所述特定音频特征;以及当来自所述第一麦克风的音频记录被确定为不包括所述特定音频特征时,没有确定来
自其它麦克风中的一个或多个麦克风的音频记录是否包括所述特定音频特征。8.根据权利要求1所述的计算机实现的方法,其中,由所述检测器确定所述音频记录的集合中的音频记录是否包括特定音频特征以及所述音频记录中的另一音频记录是否不包括所述特定音频特征包括:确定来自第一麦克风的音频记录是否包括所述特定音频特征;以及当来自所述第一麦克风的音频记录被确定为不包括所述特定音频特征时,确定来自其它麦克风中的至少一个麦克风的音频记录是否包括所述特定音频特征。9.根据权利要求1所述的计算机实现的方法,其中,所述检测器是关键词发现器,并且所述特定音频特征是检测到音频记录中说出关键词。10.一种系统,包括:数据处理装置;以及存储指令的非暂时性计算机可读介质,所述指令能够由所述数据处理装置执行并且在被执行时使得所述数据处理装置执行操作,所述操作包括:由包括多个麦克风的用户设备接收音频记录的集合,其中对于每个音频记录的集合,所述集合中的每个音频记录是在特定时间间隔期间是通过所述用户设备中的所述多个麦克风中的相应的单独麦克风来记录的,并且每个特定时间间隔对于每个音频记录的集合是不同的;对于每个音频记录的集合,由检测器确定所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。