远场语音数据扩充方法、服务器和电子设备技术

技术编号：40872584 阅读：2 留言：0更新日期：2024-04-08 16:40

本申请实施例公开一种远场语音数据扩充方法、服务器和电子设备，该方法包括：接收电子设备上传的语音数据，判别语音数据的类别；如果语音数据为远场类别，将语音数据保存至第一数据库；如果语音数据为近场类别，将语音数据保存至第二数据库；根据第一数据库筛选远场样本数据，和/或，根据第二数据库或开源语音数据集中的近场语音数据模拟远场样本数据，远场样本数据用于训练远场语音处理模型；存储远场样本数据。本申请实施例可提升远场样本数据累积和扩充的速度，规避远场样本数据与设备信道不匹配等问题，通过线上扩充数据实现对不同场景和领域的覆盖，尤其第一数据库和第二数据库的两种扩充模式共同运行时，显著提升远场样本数据的扩充速度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音，尤其涉及一种远场语音数据扩充方法、服务器和电子设备。

技术介绍

1、语音交互场景可以包括近场语音和远场语音，其中近场语音是指用户与声音采集器近距离的语音交互，例如用户手持智能手机并输入语音指令，用户长按遥控器的语音按键以向智能电视输入语音指令等。远场语音则是在相对较远的距离范围内进行的语音交互，例如用户在会议室、教室、智能家居等场景中发出语音指令，由场景中设置的如麦克风阵列等设备捕捉用户语音信号，再由语音系统对该语音信号进行处理和响应。

2、在开发远场语音的算法模型时，往往需要大量的与电子设备、与麦克风阵列适配的远场语音数据，该远场语音数据用于训练模型，以改进模型，或提升模型运算精度。但在实际积累远场语音数据时，存在如下问题：(一)如果使用设备采集远场语音数据，需耗费大量的时间和人力去录制语音数据，并对语音数据的文本进行标注，采集速度较慢，影响远场语音算法的研发效率和进度；(二)如果向某些供应商购买远场语音数据，可能存在所购买的数据与当前设备的数据采集信道不匹配等问题，且目前市面上远场语音数据数量较少，不足以涉猎所有应用场景和领域。

技术实现思路

1、本申请一些实施例提供了一种远场语音数据扩充方法、服务器和电子设备，以提升远场样本数据累积和扩充的速度，规避远场样本数据与设备、信道等不匹配的问题，通过线上持续性地动态扩充数据，实现对不同场景和领域的覆盖，进而提升模型训练效率和精度。

2、第一方面，本申请一些实施例提供一种服务器，包括：

<...

【技术特征摘要】

1.一种服务器，其特征在于，包括：

2.根据权利要求1所述的服务器，其特征在于，所述第一控制器根据所述第一数据库筛选远场样本数据，包括：

3.根据权利要求1所述的服务器，其特征在于，所述第一控制器根据所述第一数据库筛选远场样本数据，包括：

4.根据权利要求1所述的服务器，其特征在于，所述第一控制器根据所述第二数据库中的近场语音数据模拟所述远场样本数据，包括：

5.根据权利要求4所述的服务器，其特征在于，所述第一控制器设置所述远场模拟房间内的声音环境，并模拟远场音频信号，包括：

6.根据权利要求5所述的服务器，其特征在于，所述第一控制器...

【专利技术属性】
技术研发人员：刘宇，
申请(专利权)人：海信视像科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人