用于训练AI语音算法的语音数据的采集方法、蓝牙耳机和智能设备技术

技术编号：40192738 阅读：10 留言：0更新日期：2024-01-26 23:54

本申请涉及用于训练AI语音算法的语音数据的采集方法、蓝牙耳机和智能设备，在具有多个麦克风的蓝牙耳机上执行，采集方法包括：由蓝牙耳机创建多个蓝牙SPP通道，各个蓝牙SPP通道分别具有唯一的UUID标识符；由智能设备查找部分字节标识目标语音传输通道的UUID标识符，并与其对应的各个蓝牙SPP通道进行连接；由蓝牙耳机通过多个麦克风获取真实场景下的语音数据，并将所获取的语音数据通过多个蓝牙SPP通道中的可用蓝牙SPP通道传输给智能设备，以作为训练数据用于在蓝牙耳机上执行的AI语音算法的训练，因此能够消除采集到的语音数据和耳机真实数据之间的差异，数据传输受智能设备流控的影响减小。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及蓝牙耳机，更具体地，涉及用于训练ai语音算法的语音数据的采集方法、蓝牙耳机和智能设备。

技术介绍

1、随着技术的发展,基于ai的语音处理算法得到广泛的应用，然而，当基于ai的语音处理算法用于蓝牙耳机产品中时，往往会导致很多问题，譬如耳机实际使用的噪声环境和研发假定的噪声环境相差很大，导致ai算法性能下降。针对这个问题，业内一般通过特定的有线录音设备来采集真实使用场景下的语音数据，然后重新训练ai模型来解决，该方案主要包括以下步骤/模块：将ai语音算法下载到蓝牙耳机产品中，佩戴者在各种场景下测试ai算法性能；如果ai算法性能在特定噪声场景下不能达到预期效果，通过其他有线录音设备采集该场景下的语音数据；将采集的语音数据加入到ai训练集，重新训练ai模型；将新的ai模型下载到蓝牙耳机中，重新测试该噪声场景下的ai算法性能。

2、然而，采用有线录音设备来采集语音数据仍然存在如下问题：有线录音设备使用不方便，该设备可能存在需要220v供电或体积过大的问题；无法推广多人使用，用于实验室的有线录音设备价格昂贵，无法满足很多人同时使用；录音设备采集到的数据和耳机真实数据存在差异，其中包括：麦克风型号不一样，麦克风摆放位置不一样，采集到的回声数据不一样等问题。最终导致训练出来的ai算法，在真实场景下性能下降，增加了研发难度，极大降低了研发效率。

技术实现思路

1、提供了本申请以解决现有技术中存在的上述缺陷。需要用于训练ai语音算法的语音数据的采集方法、蓝牙耳机和智能设备，其能够

2、根据本申请的第一方案，提供了一种用于训练ai语音算法的语音数据的采集方法，所述ai语音算法配置为在具有多个麦克风的蓝牙耳机上执行，所述采集方法包括如下步骤。在所述蓝牙耳机与智能设备彼此连接的情况下，由所述蓝牙耳机创建多个蓝牙spp通道，各个所述蓝牙spp通道分别具有唯一的uuid标识符，各个uuid标识符的部分字节标识对应的蓝牙spp通道为目标语音传输通道。由所述智能设备查找部分字节标识目标语音传输通道的uuid标识符，并与其对应的各个蓝牙spp通道进行连接。以及由所述蓝牙耳机通过所述多个麦克风获取真实场景下的语音数据，并将所获取的语音数据通过多个所述蓝牙spp通道中的可用蓝牙spp通道传输给所述智能设备，以作为训练数据用于在所述蓝牙耳机上执行的ai语音算法的训练。

3、根据本申请的第二方案，提供了一种蓝牙耳机，所述蓝牙耳机包括第一处理模块、蓝牙模块和多个麦克风，所述蓝牙模块和多个所述麦克风分别与所述第一处理模块通信连接，所述多个麦克风分别配置为采集真实场景中的语音数据，所述蓝牙模块配置为与智能设备建立蓝牙连接，所述第一处理模块配置为执行如下步骤。在具有多个麦克风的蓝牙耳机与智能设备建立蓝牙连接的情况下，创建多个蓝牙spp通道，各个所述蓝牙spp通道分别具有uuid标识符的。在所述智能设备与所述蓝牙耳机通过所述蓝牙spp通道建立数据连接的情况下，将所述语音数据通过多个所述蓝牙spp通道发送给所述智能设备。

4、根据本申请的第三方案，提供了一种智能设备，所述智能设备包括第二蓝牙模块和第二处理模块，所述第二蓝牙模块配置为与蓝牙耳机建立蓝牙连接，所述第二处理模块配置为执行如下步骤。与所述蓝牙耳机创建的各个蓝牙spp通道建立数据连接。接收各个所述蓝牙spp通道的语音数据。在当前接收的第一数据包与上一个接收的第二数据包的包序列连续，且缓冲区没有缓存的数据包的情况下，则将当前的第一数据包写入文件。

5、本申请各个实施例提供的用于训练ai语音算法的语音数据的采集方法、蓝牙耳机和智能设备，蓝牙耳机的多个麦克风获取真实场景下的语音数据，然后通过蓝牙spp通道传输给智能设备以得到语音数据用于ai语音算法的训练，所以不必在现场使用有线录音设备来采集噪声数据，可以满足多人同时采集语音数据，且使用成本低；能够消除通过有线录音设备采集到的数据和耳机真实数据存在差异，提高训练出来的ai语音算法的性能；蓝牙spp通道分别具有唯一的uuid标识符，方便智能设备进行识别作为目标语音传输通道，通过多个蓝牙spp通道传输语音数据，能够有效地减少手机流控带来的影响，增加了spp传输带宽。

本文档来自技高网...

【技术保护点】

1.一种用于训练AI语音算法的语音数据的采集方法，其特征在于，所述AI语音算法配置为在具有多个麦克风的蓝牙耳机上执行，所述采集方法包括：

2.根据权利要求1所述的采集方法，其特征在于，所述UUID标识符包括第一标识段和第二标识段，所述第一标识段为不同蓝牙SPP通道的区分字符串，第二标识段为各个蓝牙SPP通道的识别字符串。

3.根据权利要求1所述的采集方法，其特征在于，所述采集方法还包括：所述蓝牙耳机在发送语音数据时，遍历各个所述蓝牙SPP通道，选择数据缓存空间大于等于第一阈值或没有被智能设备流控的蓝牙SPP通道发送所述语音数据；在各个蓝牙SPP通道对应的数据缓存空间小于第一阈值或被智能设备流控的情况下，放弃发送所述语音数据。

4.根据权利要求1所述的采集方法，其特征在于，所述采集方法还包括：

5.根据权利要求4所述的采集方法，其特征在于，所述采集方法还包括：由所述智能设备，

6.根据权利要求5中任一项所述的采集方法，其特征在于，所述采集方法进一步包括：

7.根据权利要求5所述的采集方法，其特征在于，所述采集方法进一步包括：

8.根据权利要求5所述的采集方法，其特征在于，所述采集方法进一步包括：在所述缓冲区的数据包的数量大于第二阈值的情况下，将所述缓冲区的各个数据包写入文件。

9.一种蓝牙耳机，其特征在于，所述蓝牙耳机包括第一处理模块、第一蓝牙模块和多个麦克风，所述第一蓝牙模块和多个所述麦克风分别与所述第一处理模块通信连接，所述多个麦克风分别配置为采集真实场景中的语音数据，所述第一蓝牙模块配置为与智能设备建立蓝牙连接，所述第一处理模块配置为：

10.根据权利要求9所述的蓝牙耳机，其特征在于，所述第一处理模块进一步配置为：在发送语音数据时，遍历各个所述蓝牙SPP通道，选择数据缓存空间大于等于第一阈值或没有被智能设备流控的蓝牙SPP通道发送所述语音数据；在各个所述蓝牙SPP通道对应的数据缓存空间分别小于第一阈值或被智能设备流控的情况下，放弃发送所述语音数据。

11.根据权利要求9所述的蓝牙耳机，其特征在于，所述第一处理模块进一步配置为：

12.一种智能设备，其特征在于，所述智能设备包括第二蓝牙模块和第二处理模块，所述第二蓝牙模块配置为与蓝牙耳机建立蓝牙连接，所述第二处理模块配置为：

13.根据权利要求12所述的智能设备，其特征在于，所述第二处理模块进一步配置为：在当前接收的第一数据包与文件中最后写入的第二数据包的包序列不连续的情况下，将所述第一数据包存入缓冲区；

14.根据权利要求12所述的智能设备，其特征在于，所述第二处理模块进一步配置为：

15.根据权利要求12所述的智能设备，其特征在于，所述第二处理模块进一步配置为：在所述缓冲区的数据包的数量大于第一阈值的情况下，将所述缓冲区的各个数据包写入文件。

...

【技术特征摘要】

1.一种用于训练ai语音算法的语音数据的采集方法，其特征在于，所述ai语音算法配置为在具有多个麦克风的蓝牙耳机上执行，所述采集方法包括：

2.根据权利要求1所述的采集方法，其特征在于，所述uuid标识符包括第一标识段和第二标识段，所述第一标识段为不同蓝牙spp通道的区分字符串，第二标识段为各个蓝牙spp通道的识别字符串。

3.根据权利要求1所述的采集方法，其特征在于，所述采集方法还包括：所述蓝牙耳机在发送语音数据时，遍历各个所述蓝牙spp通道，选择数据缓存空间大于等于第一阈值或没有被智能设备流控的蓝牙spp通道发送所述语音数据；在各个蓝牙spp通道对应的数据缓存空间小于第一阈值或被智能设备流控的情况下，放弃发送所述语音数据。

4.根据权利要求1所述的采集方法，其特征在于，所述采集方法还包括：

5.根据权利要求4所述的采集方法，其特征在于，所述采集方法还包括：由所述智能设备，

6.根据权利要求5中任一项所述的采集方法，其特征在于，所述采集方法进一步包括：

7.根据权利要求5所述的采集方法，其特征在于，所述采集方法进一步包括：

9.一种蓝牙耳机，其特征在于，所述蓝牙耳机包括第一处理模块、第一蓝...

【专利技术属性】
技术研发人员：霍允杰，范羽，
申请(专利权)人：恒玄科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人