特征信息挖掘方法、装置及电子设备制造方法及图纸

技术编号:27979630 阅读:27 留言:0更新日期:2021-04-06 14:14
本申请公开了一种特征信息挖掘方法、装置及电子设备,涉及语音识别技术、机器学习、深度学习等人工智能技术领域。该方案为:确定目标设备的使用场景;获取原始音频数据;对所述原始音频数据进行所述使用场景的模拟,以生成所述使用场景的目标音频数据;对所述目标音频数据进行特征提取,获取所述使用场景的特征信息。本申请中,不再依赖海量音频数据的积累,有效地解决了各种场景数据缺失的问题,能够准确、高效地进行使用特征信息挖掘,提高了使用特征信息挖掘过程中的效率和可靠性。

【技术实现步骤摘要】
特征信息挖掘方法、装置及电子设备
本申请的实施例总体上涉及数据处理
,并且更具体地涉及语音识别技术、机器学习、深度学习等人工智能

技术介绍
近年来,随着语音识别技术的迅速发展,基于语音识别技术的各种智能设备,如智能音箱、智能车载、大厅导览等也得到了广泛的应用。其中,在试图对一段语音进行识别时,首先需要对语音进行特征提取,然后将提取的特征输入预先搭建好的使用场景的语音模型中,以实现语音识别。然而,由于,针对设备的不同使用场景、用户的不同使用目的等原因,在进行使用场景的语音模型的构建或者训练过程中,势必需要依赖大量音频数据。然而由于前述音频数据是极为有限的,势必导致特征信息挖掘过程中存在效率极低、成本高、耗时久的问题。因此,如何在确保使用场景的特征信息结果的准确性的同时,提高特征信息挖掘过程中的效率和可靠性,已成为了重要的研究方向之一
技术实现思路
本申请提供了一种特征信息挖掘方法、装置及电子设备。根据第一方面,提供了一种特征信息挖掘方法,包括:确定目标设备的使用场景;获取原始音频本文档来自技高网...

【技术保护点】
1.一种特征信息挖掘方法,包括:/n确定目标设备的使用场景;/n获取原始音频数据;/n对所述原始音频数据进行所述使用场景的模拟,以生成所述使用场景的目标音频数据;/n对所述目标音频数据进行特征提取,获取所述使用场景的特征信息。/n

【技术特征摘要】
1.一种特征信息挖掘方法,包括:
确定目标设备的使用场景;
获取原始音频数据;
对所述原始音频数据进行所述使用场景的模拟,以生成所述使用场景的目标音频数据;
对所述目标音频数据进行特征提取,获取所述使用场景的特征信息。


2.根据权利要求1所述的特征信息挖掘方法,其中,所述对所述原始音频数据进行所述使用场景的模拟,以生成所述使用场景的目标音频数据,包括:
获取所述使用场景的场景音频数据;
在所述原始音频数据中添加所述场景音频数据,以生成所述目标音频数据。


3.根据权利要求2所述的特征信息挖掘方法,其中,所述场景音频数据包括所述使用场景的空间混响数据,则所述获取所述使用场景的场景音频数据,包括:
获取所述使用场景的属性信息;
获取所述目标设备在所述使用场景中的状态信息和所述目标设备的设备信息;
根据所述属性信息、所述状态信息和所述设备信息,生成所述使用场景对应的所述空间混响数据。


4.根据权利要求2所述的特征信息挖掘方法,其中,所述场景音频数据包括所述使用场景的环境噪声数据,则所述获取所述使用场景的场景音频数据,包括:
从所述环境噪声数据的噪声数据库中,获取所述使用场景的环境噪声数据。


5.根据权利要求4所述的特征信息挖掘方法,其中,所述环境噪声数据包括至少两类环境噪声数据,所述从所述环境噪声数据的噪声数据库中,获取所述使用场景的环境噪声数据,包括:
获取所述使用场景的类型,并根据所述使用场景的类型,获取所述至少两类环境噪声数据的占比;
按照所述至少两类环境噪声数据的占比,分别从各自的噪声数据库中,随机获取所述至少两类环境噪声数据。


6.根据权利要求2所述的特征信息挖掘方法,其中,所述场景音频数据包括所述目标设备内部噪声的噪声残余数据,则所述获取所述使用场景的场景音频数据,包括:
从所述噪声残余数据的残余数据库中,获取所述使用场景的噪声残余数据。


7.根据权利要求2-6任一项所述的特征信息挖掘方法,其中,所述在所述原始音频数据中添加所述场景音频数据,以生成所述目标音频数据,包括:
至少一次从所述场景音频数据中选取候选场景音频数据,其中,每次选取出的所述候选场景音频数据不同;
在所述原始音频数据中添加每次获取到的所述候选场景音频数据中。


8.根据权利要求1-6任一项所述的特征信息挖掘方法,其中,所述获取所述使用场景的特征信息之后,还包括:
基于所述使用场景的特征信息,构建或者训练所述使用场景的语音模型。


9.一种特征信息挖掘装置,包括:
确定模块,用于确定目标设备的使用场景;
第一获取模块,用于获取原始音频数据;
生成模块,用于对所述原始音频数据进行所述使用场景的模拟,以生成所述...

【专利技术属性】
技术研发人员:革家象吴震周茂仁臧启光文铭付晓寅
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1