语音数据处理方法、装置及智能车辆制造方法及图纸

技术编号：26422424 阅读：40 留言：0更新日期：2020-11-20 14:18

本申请公开了一种语音数据处理方法、装置及智能车辆，涉及数据处理技术领域中的语音数据处理技术领域、自然语言处理技术领域、语音交互技术领域以及自动驾驶技术领域等。具体实现方案为：当多个麦克风采集的多路语音数据中都包括唤醒词，将多路语音数据中能量最大的语音数据对应的麦克风作为目标麦克风，并在后续通过目标麦克风采集的语音数据识别其中的指令。从而在终端设备在唤醒后，选择能量最大的语音数据对应的麦克风对语音数据中指令进行识别，防止使用其他麦克风无法识别指令或者识别错误指令的情况，提高车载终端对语音数据处理时识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据处理方法、装置及智能车辆
本申请涉及数据处理技术中的语音数据处理
、自然语言处理
、语音交互
以及自动驾驶
等，尤其涉及一种语音数据处理方法、装置及智能车辆。
技术介绍
目前，随着语音识别技术的不断发展，一些智能车辆上设置的车载终端可以接收麦克风采集车辆内人员说话时的语音数据，并通过语音识别技术确定语音数据中人员的指令，并执行该指令，从而实现了车辆内人员通过语音方式对车载终端进行控制，提高了车辆的智能化程度。现有技术中，由于对语音数据中指令进行识别的算法复杂度较高，车载终端为了避免资源浪费，在接收到麦克风采集的语音数据后，首先对语音数据中的唤醒词进行识别，只有在识别到语音数据中包括唤醒词的情况下，才会识别唤醒词之后的语音数据中的指令，从而提高车载终端的工作效率。但是，当车辆内设置多个麦克风时，多个麦克风都可能接收到语音数据并识别出唤醒词，由于识别唤醒词的算法精度较低，无法准确地确定出后续应该对哪一个麦克风的语音数据中的指令进行识别，进而导致语音数据中指令识别不准确，甚至识别出错误的指令，降低语音数据的处理准确性。
技术实现思路
本申请提供了语音数据处理方法、装置及智能车辆，用于解决现有技术中语音数据处理时准确性较差的技术问题。本申请第一方面提供一种语音数据处理方法，包括：当第一时间段的语音数据包括目标词汇，确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风；其中，所述多路第一语音数据由设置在车辆内的多个麦克风在所述第...

【技术保护点】
1.一种语音数据处理方法，其特征在于，包括：/n当第一时间段的语音数据包括目标词汇，确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风；其中，所述多路第一语音数据由设置在车辆内的多个麦克风在所述第一时间段采集；/n获取所述目标麦克风在第二时间段采集的第二语音数据；其中，所述第二时间段位于所述第一时间段之后；/n识别所述第二语音数据中包括的指令。/n

【技术特征摘要】
1.一种语音数据处理方法，其特征在于，包括：
当第一时间段的语音数据包括目标词汇，确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风；其中，所述多路第一语音数据由设置在车辆内的多个麦克风在所述第一时间段采集；
获取所述目标麦克风在第二时间段采集的第二语音数据；其中，所述第二时间段位于所述第一时间段之后；
识别所述第二语音数据中包括的指令。

2.根据权利要求1所述的方法，其特征在于，所述确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风，包括：
从所述多路第一语音数据中，确定包括所述目标词汇的一路或多路候选第一语音数据；
从所述一路或多路候选第一语音数据中，确定能量最大的第一语音数据对应的麦克风为目标麦克风。

3.根据权利要求2所述的方法，其特征在于，所述从所述一路或多路候选第一语音数据中，确定能量最大的第一语音数据对应的麦克风为目标麦克风，包括：
从存储模块中，获取所述一路或多路候选第一语音数据在所述第一时间段的能量；其中，所述存储模块用于存储所述多个麦克风采集的语音数据的能量；
根据所述一路或多路候选第一语音数据能量，确定能量最大的第一语音数据对应的麦克风为目标麦克风。

4.根据权利要求3所述的方法，其特征在于，所述确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风之前，还包括：
获取所述多个麦克风在所述第一时间段采集的多路第一语音数据；
计算所述多路第一语音数据在所述第一时间段的能量；
将所述多路第一语音数据在所述第一时间段的能量存入存储模块。

5.根据权利要求4所述的方法，其特征在于，对于任一个第一语音数据，所述计算所述第一语音数据在所述第一时间段的能量，包括：
按照预设时间窗口，对所述第一语音数据在所述第一时间段内进行加窗分帧处理，得到所述第一语音数据在所述第一时间段的多个频域特征；
将所述多个频域特征的频域能量平均值，作为所述第一语音数据在所述第一时间段的能量。

6.根据权利要求1-5任一项所述的方法，其特征在于，识别所述第二语音数据中包括的指令，包括：
向网络设备发送所述第二语音数据；
接收所述网络设备发送的所述第二语音数据中包括的指令。

7.一种语音数据处理装置，其特征在于，包括；
确定模块，用于当第一时间段的语音数据包括目标词汇，确定多路第一语音数据中能量最大的第一语音数据对应的麦克风为目标麦克风；其中，所述多路第一语音数据由设置在车辆内的多个麦克风在所述第一时间段采集；
获取模块，用于获取所述目标麦克风在第二时间段采集的第二语音数据；其中，所述第二时...

【专利技术属性】
技术研发人员：周毅，左声勇，殷切，陈真，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人