用于生成样本的方法和装置制造方法及图纸

技术编号:19483215 阅读:15 留言:0更新日期:2018-11-17 10:56
本申请实施例公开了用于生成样本的方法和装置。该方法的一具体实施方式包括:获取候选室内混响集合;对候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;将混响时间分布划分为至少一个混响时间分布区间,确定落入至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;对至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,生成样本室内混响集合。该实施方式实现了快速地生成用于训练声学模型的样本。

【技术实现步骤摘要】
用于生成样本的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成样本的方法和装置。
技术介绍
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。通常,语音识别模型可以包括声学模型和语言模型。其中,声学模型可以将把语音映射成音素,语言模型可以将音素映射成完整的句子。因此,若要得到识别准确度较高的语音识别模型,就需要训练出能够表征语音与音素之间对应关系的声学模型。这时,就需要获取样本来训练出能够表征语音与音素之间对应关系的声学模型。
技术实现思路
本申请实施例提出了用于生成样本的方法和装置。第一方面,本申请实施例提供了一种用于生成样本的方法,包括:获取候选室内混响集合;对候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;将混响时间分布划分为至少一个混响时间分布区间,确定落入至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;对至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,生成样本室内混响集合。在一些实施例中,将混响时间分布划分为至少一个混响时间分布区间,包括:确定候选室内混响集合中的候选室内混响的最大混响时间和最小混响时间;计算最大混响时间与最小混响时间的差值;将所得到的差值与预设区间精度的乘积作为划分粒度;基于划分粒度对混响时间分布进行划分,得到至少一个混响时间分布区间。在一些实施例中,对至少一个混响时间分布区间进行抽样,包括:对至少一个混响时间分布区间进行重新排列,得到排列后的至少一个混响时间分布区间;按照排列后的至少一个混响时间分布区间中的混响时间分布区间的排列顺序,对排列后的至少一个混响时间分布区间进行马尔可夫过程抽样。在一些实施例中,按照排列后的至少一个混响时间分布区间中的混响时间分布区间的排列顺序,对排列后的至少一个混响时间分布区间进行马尔可夫过程抽样,包括:对于排列后的至少一个混响时间分布区间中的每个混响时间分布区间,统计落入该混响时间分布区间内的候选室内混响的数量;将落入该混响时间分布区间内的候选室内混响的数量与候选室内混响集合中的候选室内混响的总数量的比值作为该混响时间分布区间的概率分布;获取该混响时间分布区间的样本概率分布;基于该混响时间分布区间的概率分布和样本概率分布,生成该混响时间分布区间的接受概率;将该混响时间分布区间的接受概率与预先生成的随机数进行比较;基于比较结果,确定是否抽取该混响时间分布区间。在一些实施例中,该方法还包括:确定样本室内混响集合中的样本室内混响的音素;将样本室内混响集合中的样本室内混响作为输入,将输入的样本室内混响的音素作为输出,训练得到声学模型。在一些实施例中,该方法还包括:获取待识别室内混响;将待识别室内混响输入至声学模型,得到待识别室内混响的音素。第二方面,本申请实施例提供了一种用于生成样本的装置,包括:第一获取单元,被配置成获取候选室内混响集合;统计单元,被配置成对候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;划分单元,被配置成将混响时间分布划分为至少一个混响时间分布区间,确定落入至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;抽样单元,被配置成对至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,生成样本室内混响集合。在一些实施例中,划分单元包括:确定子单元,被配置成确定候选室内混响集合中的候选室内混响的最大混响时间和最小混响时间;第一计算子单元,被配置成计算最大混响时间与最小混响时间的差值;第二计算子单元,被配置成将所得到的差值与预设区间精度的乘积作为划分粒度;划分子单元,被配置成基于划分粒度对混响时间分布进行划分,得到至少一个混响时间分布区间。在一些实施例中,抽样单元包括:排列子单元,被配置成对至少一个混响时间分布区间进行重新排列,得到排列后的至少一个混响时间分布区间;抽样子单元,被配置成按照排列后的至少一个混响时间分布区间中的混响时间分布区间的排列顺序,对排列后的至少一个混响时间分布区间进行马尔可夫过程抽样。在一些实施例中,抽样子单元进一步被配置成:对于排列后的至少一个混响时间分布区间中的每个混响时间分布区间,统计落入该混响时间分布区间内的候选室内混响的数量;将落入该混响时间分布区间内的候选室内混响的数量与候选室内混响集合中的候选室内混响的总数量的比值作为该混响时间分布区间的概率分布;获取该混响时间分布区间的样本概率分布;基于该混响时间分布区间的概率分布和样本概率分布,生成该混响时间分布区间的接受概率;将该混响时间分布区间的接受概率与预先生成的随机数进行比较;基于比较结果,确定是否抽取该混响时间分布区间。在一些实施例中,该装置还包括:确定单元,被配置成确定样本室内混响集合中的样本室内混响的音素;训练单元,被配置成将样本室内混响集合中的样本室内混响作为输入,将输入的样本室内混响的音素作为输出,训练得到声学模型。在一些实施例中,该装置还包括:第二获取单元,被配置成获取待识别室内混响;识别单元,被配置成将待识别室内混响输入至声学模型,得到待识别室内混响的音素。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于生成样本的方法和装置,通过对候选室内混响集合中的候选室内混响的混响时间进行统计,从而得到混响时间分布;然后将混响时间分布划分为至少一个混响时间分布区间,以确定落入至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;最后对至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,以生成样本室内混响集合。从而实现了快速地生成用于训练声学模型的样本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构;图2是根据本申请的用于生成样本的方法的一个实施例的流程图;图3是图2所提供的用于生成样本的方法的一个应用场景的流程图;图4是根据本申请的用于生成样本的方法的又一个实施例的流程图;图5是根据本申请的用于生成样本的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合本文档来自技高网...

【技术保护点】
1.一种用于生成样本的方法,包括:获取候选室内混响集合;对所述候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;将所述混响时间分布划分为至少一个混响时间分布区间,确定落入所述至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;对所述至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,生成样本室内混响集合。

【技术特征摘要】
1.一种用于生成样本的方法,包括:获取候选室内混响集合;对所述候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;将所述混响时间分布划分为至少一个混响时间分布区间,确定落入所述至少一个混响时间分布区间中的混响时间分布区间内的候选室内混响;对所述至少一个混响时间分布区间进行抽样,得到落入所抽样出的混响时间分布区间内的候选室内混响,生成样本室内混响集合。2.根据权利要求1所述的方法,其中,所述将所述混响时间分布划分为至少一个混响时间分布区间,包括:确定所述候选室内混响集合中的候选室内混响的最大混响时间和最小混响时间;计算所述最大混响时间与所述最小混响时间的差值;将所得到的差值与预设区间精度的乘积作为划分粒度;基于所述划分粒度对所述混响时间分布进行划分,得到至少一个混响时间分布区间。3.根据权利要求2所述的方法,其中,所述对所述至少一个混响时间分布区间进行抽样,包括:对所述至少一个混响时间分布区间进行重新排列,得到排列后的至少一个混响时间分布区间;按照所述排列后的至少一个混响时间分布区间中的混响时间分布区间的排列顺序,对所述排列后的至少一个混响时间分布区间进行马尔可夫过程抽样。4.根据权利要求3所述的方法,其中,所述按照所述排列后的至少一个混响时间分布区间中的混响时间分布区间的排列顺序,对所述排列后的至少一个混响时间分布区间进行马尔可夫过程抽样,包括:对于所述排列后的至少一个混响时间分布区间中的每个混响时间分布区间,统计落入该混响时间分布区间内的候选室内混响的数量;将落入该混响时间分布区间内的候选室内混响的数量与所述候选室内混响集合中的候选室内混响的总数量的比值作为该混响时间分布区间的概率分布;获取该混响时间分布区间的样本概率分布;基于该混响时间分布区间的概率分布和样本概率分布,生成该混响时间分布区间的接受概率;将该混响时间分布区间的接受概率与预先生成的随机数进行比较;基于比较结果,确定是否抽取该混响时间分布区间。5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:确定所述样本室内混响集合中的样本室内混响的音素;将所述样本室内混响集合中的样本室内混响作为输入,将输入的样本室内混响的音素作为输出,训练得到声学模型。6.根据权利要求5所述的方法,其中,所述方法还包括:获取待识别室内混响;将所述待识别室内混响输入至所述声学模型,得到所述待识别室内混响的音素。7.一种用于生成样本的装置,包括:第一获取单元,被配置成获取候选室内混响集合;统计单元,被配置成对所述候选室内混响集合中的候选室内混响的混响时间进行统计,得到混响时间分布;划分单元,被配置成将所述混响时间分...

【专利技术属性】
技术研发人员:李超文铭孙建伟朱唯鑫
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1