【技术实现步骤摘要】
【国外来华专利技术】音频采集装置、音频接收装置及音频处理方法
本申请实施例涉及信息处理
,尤其涉及一种音频采集装置、音频接收装置、音频处理方法及音频采集系统。
技术介绍
语音交互,是一种常见的人机交互方式。在语音交互时,人可以通过语音对被控设备进行控制,从而解放双手。但在某些场景中,若用户与被控设备距离较远,由于被控设备采集的音频数据的信噪比降低,被控设备很可能无法准确识别用户的指令。比如在一个场景中,用户使用了自拍杆夹持运动相机进行拍摄,在对运动相机进行语音控制时,由于自拍杆增加了控制距离,运动相机难以采集到的清晰的音频数据,因此语音识别的准确率也将大大降低。
技术实现思路
为克服相关技术中存在的问题,本申请实施例提供了一种音频采集装置、音频接收装置、音频处理方法及音频采集系统。根据本申请实施例的第一方面,提供一种音频采集装置,包括:麦克风、处理器以及无线收发器;所述处理器,用于对所述麦克风采集的音频数据进行指令识别处理,得到控制指令;还用于通过所述无线收发器将所述音频数据和所述控制指令发送给音频接收 ...
【技术保护点】
1.一种音频采集装置,其特征在于,包括:麦克风、处理器以及无线收发器;/n所述处理器,用于对所述麦克风采集的音频数据进行指令识别处理,得到控制指令;还用于通过所述无线收发器将所述音频数据和所述控制指令发送给音频接收装置;/n其中,所述音频数据用于一个或多个电子设备执行媒体处理,所述控制指令用于一个或多个电子设备执行控制处理,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。/n
【技术特征摘要】
【国外来华专利技术】1.一种音频采集装置,其特征在于,包括:麦克风、处理器以及无线收发器;
所述处理器,用于对所述麦克风采集的音频数据进行指令识别处理,得到控制指令;还用于通过所述无线收发器将所述音频数据和所述控制指令发送给音频接收装置;
其中,所述音频数据用于一个或多个电子设备执行媒体处理,所述控制指令用于一个或多个电子设备执行控制处理,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
2.根据权利要求1所述的音频采集装置,其特征在于,所述处理器还用于,在将所述音频数据发送给所述音频接收装置之前,对所述音频数据进行编码。
3.根据权利要求2所述的音频采集装置,其特征在于,所述处理器进行指令识别处理的音频数据为编码前的音频数据。
4.根据权利要求1所述的音频采集装置,其特征在于,所述音频数据与所述控制指令被封装成数据包发送给所述音频接收装置。
5.根据权利要求4所述的音频采集装置,其特征在于,在封装所述数据包之前,所述控制指令被嵌入所述音频数据。
6.根据权利要求5所述的音频采集装置,其特征在于,所述控制指令被转化为音频数字水印后嵌入所述音频数据。
7.根据权利要求6所述的音频采集装置,其特征在于,所述音频数字水印的频率在指定频率范围内,其中,所述指定频率范围为人耳听觉频率范围以外的频率范围。
8.根据权利要求5所述的音频采集装置,其特征在于,所述控制指令嵌入的音频数据为编码前的音频数据。
9.根据权利要求1所述的音频采集装置,其特征在于,所述处理器对所述麦克风采集的音频数据进行指令识别处理的方式具体包括:
截取所述音频数据中包含语音的音频片段;
提取所述音频片段的音频特征;
将所述音频特征输入指定的语音识别模型,识别出所述控制指令。
10.根据权利要求1所述的音频采集装置,其特征在于,还包括:控制传感器;
所述控制指令还包括另一种由所述控制传感器响应于用户的触发生成的控制指令。
11.根据权利要求1所述的音频采集装置,其特征在于,所述处理器还用于,对识别出所述控制指令的目标音频片段进行处理。
12.根据权利要求11所述的音频采集装置,其特征在于,对所述目标音频片段的处理包括以下一种或多种:消音、增强、变声。
13.根据权利要求1所述的音频采集装置,其特征在于,所述控制指令对应的音频数据的类型包括:语音类型和/或非语音类型。
14.根据权利要求1所述的音频采集装置,其特征在于,所述电子设备为所述音频接收装置通信连接的其他电子设备;
所述音频数据用于所述音频接收装置将所述音频数据发送给所述电子设备以执行媒体处理;
所述控制指令用于所述音频接收装置将所述控制指令发送给所述电子设备以执行控制处理。
15.根据权利要求1所述的音频采集装置,其特征在于,所述电子设备为所述音频接收装置;
所述音频数据用于所述音频接收装置执行媒体处理;
所述控制指令用于所述音频接收装置执行控制处理。
16.根据权利要求1所述的音频采集装置,其特征在于,所述电子设备包括一个或多个摄像头。
17.根据权利要求1所述的音频采集装置,其特征在于,所述电子设备包括以下任一设备:无人机、相机、云台、无人车。
18.根据权利要求1所述的音频采集装置,其特征在于,所述媒体处理包括:音频编辑和/或音视频编辑。
19.一种音频采集装置,其特征在于,包括:麦克风,处理器以及无线收发器,所述处理器,用于对所述麦克风采集的音频数据进行识别处理,得到辅助识别信息;还用于通过所述无线收发器将所述音频数据和所述辅助识别信息发送给音频接收装置;
其中,所述音频数据用于一个或多个电子设备执行媒体处理,所述辅助识别信息用于一个或多个电子设备根据所述辅助识别信息从所述音频数据中识别控制指令,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
20.根据权利要求19所述的音频采集装置,其特征在于,所述辅助识别信息包括以下一种或者多种信息:用于指示出控制指令所对应的音频片段的片段标识信息、控制指令所对应的音频数据的类型、控制指令所对应的控制内容信息。
21.根据权利要求20所述的音频采集装置,其特征在于,控制指令所对应的音频数据的类型包括:语音类型和/或非语音类型。
22.根据权利要求19所述的音频采集装置,其特征在于,所述处理器还用于,在将所述音频数据发送给所述音频接收装置之前,对所述音频数据进行编码。
23.根据权利要求22所述的音频采集装置,其特征在于,所述处理器进行识别处理的音频数据为编码前的音频数据。
24.根据权利要求19所述的音频采集装置,其特征在于,所述音频数据与所述辅助识别信息被封装成数据包发送给所述音频接收装置。
25.根据权利要求24所述的音频采集装置,其特征在于,在封装所述数据包之前,所述辅助识别信息被嵌入所述音频数据。
26.根据权利要求25所述的音频采集装置,其特征在于,所述辅助识别信息被转化为音频数字水印后嵌入所述音频数据。
27.根据权利要求26所述的音频采集装置,其特征在于,所述音频数字水印的频率在指定频率范围内,其中,所述指定频率范围为人耳听觉频率范围以外的频率范围。
28.根据权利要求25所述的音频采集装置,其特征在于,所述辅助识别信息嵌入的音频数据为编码前的音频数据。
29.根据权利要求19所述的音频采集装置,其特征在于,还包括:控制传感器;
所述控制指令还包括另一种由所述控制传感器响应于用户的触发生成的控制指令。
30.根据权利要求19所述的音频采集装置,其特征在于,所述处理器还用于,对控制指令所对应的音频片段进行处理。
31.根据权利要求30所述的音频采集装置,其特征在于,对控制指令所对应的音频片段的处理包括以下一种或多种:增强、降噪、润色。
32.根据权利要求19所述的音频采集装置,其特征在于,所述电子设备为所述音频接收装置通信连接的其他电子设备;
所述音频数据用于所述音频接收装置将所述音频数据发送给所述电子设备以执行媒体处理;
所述辅助识别信息用于所述音频接收装置将所述辅助识别信息发送给所述电子设备,以根据所述辅助识别信息从所述音频数据中识别控制指令。
33.根据权利要求19所述的音频采集装置,其特征在于,所述电子设备为所述音频接收装置;
所述音频数据用于所述音频接收装置执行媒体处理;
所述辅助识别信息用于所述音频接收装置根据所述辅助识别信息从所述音频数据中识别控制指令。
34.根据权利要求19所述的音频采集装置,其特征在于,所述电子设备包括一个或多个摄像头。
35.根据权利要求19所述的音频采集装置,其特征在于,所述电子设备包括以下任一设备:无人机、相机、云台、无人车。
36.根据权利要求19所述的音频采集装置,其特征在于,所述媒体处理包括:音频编辑和/或音视频剪辑。
37.一种音频接收装置,其特征在于,包括:无线收发器与处理器;
所述处理器,用于通过所述无线收发器接收音频采集装置发送的音频数据与控制指令;其中,所述控制指令是所述音频采集装置对所采集的音频数据进行指令识别处理得到;
所述音频数据用于一个或多个电子设备执行媒体处理,所述控制指令用于一个或多个电子设备执行控制处理,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
38.根据权利要求37所述的音频接收装置,其特征在于,所述处理器还用于,对接收到的音频数据进行解码。
39.根据权利要求38所述的音频接收装置,其特征在于,所述控制指令是所述音频采集装置对编码前的音频数据进行指令识别处理得到。
40.根据权利要求39所述的音频接收装置,其特征在于,所述处理器还用于,对通过所述无线收发器接收到的数据包进行解封装,得到所述音频数据与所述控制指令。
41.根据权利要求40所述的音频接收装置,其特征在于,对所述数据包进行解封装得到的是嵌入有所述控制指令的音频数据。
42.根据权利要求41所述的音频接收装置,其特征在于,所述处理器还用于,对所述嵌入有所述控制指令的音频数据进行分离,得到所述控制指令所转化的音频数字水印与音频数据。
43.根据权利要求42所述的音频接收装置,其特征在于,所述音频数字水印的频率在指定频率范围内,其中,所述指定频率范围为人耳听觉频率范围以外的频率范围。
44.根据权利要求41所述的音频接收装置,其特征在于,对所述嵌入有所述控制指令的音频数据进行分离得到的音频数据是编码前音频数据。
45.根据权利要求37所述的音频接收装置,其特征在于,所述控制指令是,所述音频采集装置通过截取音频数据中包含语音的音频片段,提取所述音频片段的音频特征,再将所述音频特征输入指定的语音识别模型后得到的。
46.根据权利要求37所述的音频接收装置,其特征在于,接收到的所述控制指令还包括另一种由所述音频采集装置的控制传感器响应于用户的触发生成的控制指令。
47.根据权利要求37所述的音频接收装置,其特征在于,接收到的音频数据中的目标音频片段经过所述音频采集装置的处理,所述目标音频片段为所述控制指令对应的音频片段。
48.根据权利要求47所述的音频接收装置,其特征在于,所述目标音频片段经过的处理包括以下一种或多种:消音、增强、变声。
49.根据权利要求37所述的音频接收装置,其特征在于,所述控制指令对应的音频数据的类型包括:语音类型和/或非语音类型。
50.根据权利要求37所述的音频接收装置,其特征在于,所述电子设备为所述音频接收装置通信连接的其他电子设备;
所述处理器还用于,将接收到的音频数据和控制指令发送给所述电子设备。
51.根据权利要求37所述的音频接收装置,其特征在于,所述电子设备为所述音频接收装置;
所述处理器还用于,利用所述音频数据执行媒体处理,执行所述控制指令对应的操作。
52.根据权利要求37所述的音频接收装置,其特征在于,所述媒体处理包括:音频编辑和/或音视频编辑。
53.根据权利要求37所述的音频接收装置,其特征在于,所述电子设备包括一个或多个摄像头。
54.根据权利要求37所述的音频接收装置,其特征在于,所述电子设备包括以下任一设备:无人机、相机、云台、无人车。
55.一种音频接收装置,其特征在于,包括:无线收发器与处理器;
所述处理器,用于通过所述无线收发器接收音频采集装置发送的音频数据与辅助识别信息;其中,所述辅助识别信息是所述音频采集装置对所采集的音频数据进行识别处理得到;
所述音频数据用于一个或多个电子设备执行媒体处理,所述辅助识别信息用于一个或多个电子设备根据所述辅助识别信息从所述音频数据中识别控制指令,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
56.根据权利要求55所述的音频接收装置,其特征在于,所述辅助识别信息包括以下一种或者多种信息:用于指示出控制指令所对应的音频片段的片段标识信息、控制指令所对应的音频数据的类型、控制指令所对应的控制内容信息。
57.根据权利要求56所述的音频接收装置,其特征在于,控制指令所对应的音频数据的类型包括:语音类型和/或非语音类型。
58.根据权利要求55所述的音频接收装置,其特征在于,所述处理器还用于,对接收到的音频数据进行解码。
59.根据权利要求58所述的音频接收装置,其特征在于,所述辅助识别信息是所述音频采集装置对编码前的音频数据进行识别处理得到。
60.根据权利要求55所述的音频接收装置,其特征在于,所述处理器还用于,对通过所述无线收发器接收到的数据包进行解封装,得到所述音频数据与所述辅助识别信息。
61.根据权利要求60所述的音频接收装置,其特征在于,对所述数据包进行解封装得到的是嵌入有所述辅助识别信息的音频数据。
62.根据权利要求61所述的音频接收装置,其特征在于,所述处理器还用于,对所述嵌入有所述辅助识别信息的音频数据进行分离,得到所述辅助识别信息所转化的音频数字水印与音频数据。
63.根据权利要求62所述的音频接收装置,其特征在于,所述音频数字水印的频率在指定频率范围内,其中,所述指定频率范围为人耳听觉频率范围以外的频率范围。
64.根据权利要求61所述的音频接收装置,其特征在于,对所述嵌入有所述辅助识别信息的音频数据进行分离得到的音频数据是编码前音频数据。
65.根据权利要求55所述的音频接收装置,其特征在于,所述处理器还用于,通过所述无线收发器接收所述音频采集装置发送的控制指令;所接收的控制指令是另一种所述音频采集装置的控制传感器响应于用户的触发生成的控制指令。
66.根据权利要求55所述的音频接收装置,其特征在于,接收到的音频数据中的目标音频片段经过所述音频采集装置的处理,所述目标音频片段为所述控制指令对应的音频片段。
67.根据权利要求66所述的音频接收装置,其特征在于,所述目标音频片段经过的处理包括以下一种或多种:增强、降噪、润色。
68.根据权利要求55所述的音频接收装置,其特征在于,所述媒体处理包括:音频编辑和/或音视频编辑。
69.根据权利要求55所述的音频接收装置,其特征在于,所述电子设备为所述音频接收装置通信连接的其他电子设备;
所述处理器还用于,将接收到的音频数据和辅助识别信息发送给所述电子设备。
70.根据权利要求55所述的音频接收装置,其特征在于,所述电子设备为所述音频接收装置;
所述处理器还用于,利用所述音频数据执行媒体处理,根据所述辅助识别信息从所述音频数据中识别控制指令。
71.根据权利要求55所述的音频接收装置,其特征在于,所述电子设备包括一个或多个摄像头。
72.根据权利要求55所述的音频接收装置,其特征在于,所述电子设备包括以下任一设备:无人机、相机、云台、无人车。
73.一种音频处理方法,其特征在于,应用于音频采集装置,所述方法包括:
对采集的音频数据进行指令识别处理,得到控制指令;
通过无线网络将所述音频数据和所述控制指令发送给音频接收装置;
其中,所述音频数据用于一个或多个电子设备执行媒体处理,所述控制指令用于一个或多个电子设备执行控制处理,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
74.根据权利要求73所述的音频处理方法,其特征在于,在将所述音频数据发送给所述音频接收装置之前,所述方法还包括:
对所述音频数据进行编码。
75.根据权利要求74所述的音频处理方法,其特征在于,进行指令识别处理的音频数据为编码前的音频数据。
76.根据权利要求73所述的音频处理方法,其特征在于,将所述音频数据和所述控制指令发送给音频接收装置,包括:
将所述音频数据与所述控制指令封装成数据包发送给所述音频接收装置。
77.根据权利要求76所述的音频处理方法,其特征在于,将所述音频数据与所述控制指令封装成数据包,包括:
将所述控制指令嵌入所述音频数据;
将嵌入有所述控制指令的音频数据封装成数据包。
78.根据权利要求77所述的音频处理方法,其特征在于,在将所述控制指令嵌入所述音频数据之前,所述方法还包括:
将所述控制指令转化为音频数字水印。
79.根据权利要求78所述的音频处理方法,其特征在于,所述音频数字水印的频率在指定频率范围内,其中,所述指定频率范围为人耳听觉频率范围以外的频率范围。
80.根据权利要求77所述的音频处理方法,其特征在于,所述控制指令嵌入的音频数据为编码前的音频数据。
81.根据权利要求73所述的音频处理方法,其特征在于,对采集的音频数据进行指令识别处理,包括:
截取所述音频数据中包含语音的音频片段;
提取所述音频片段的音频特征;
将所述音频特征输入指定的语音识别模型,识别出所述控制指令。
82.根据权利要求73所述的音频处理方法,其特征在于,所述控制指令还包括另一种响应于用户的触发生成的控制指令。
83.根据权利要求73所述的音频处理方法,其特征在于,还包括:
对识别出所述控制指令的目标音频片段进行处理。
84.根据权利要求83所述的音频处理方法,其特征在于,对所述目标音频片段的处理包括以下一种或多种:消音、增强、变声。
85.根据权利要求73所述的音频处理方法,其特征在于,所述控制指令对应的音频数据的类型包括:语音类型和/或非语音类型。
86.根据权利要求73所述的音频处理方法,其特征在于,所述电子设备为所述音频接收装置通信连接的其他电子设备;
所述音频数据用于所述音频接收装置将所述音频数据发送给所述电子设备以执行媒体处理;
所述控制指令用于所述音频接收装置将所述控制指令发送给所述电子设备以执行控制处理。
87.根据权利要求73所述的音频处理方法,其特征在于,所述电子设备为所述音频接收装置;
所述音频数据用于所述音频接收装置执行媒体处理;
所述控制指令用于所述音频接收装置执行控制处理。
88.根据权利要求73所述的音频处理方法,其特征在于,所述电子设备包括一个或多个摄像头。
89.根据权利要求73所述的音频处理方法,其特征在于,所述电子设备包括以下任一设备:无人机、相机、云台、无人车。
90.根据权利要求73所述的音频处理方法,其特征在于,所述媒体处理包括:音频编辑和/或音视频编辑。
91.一种音频处理方法,其特征在于,应用于音频采集装置,所述方法包括:
对采集的音频数据进行识别处理,得到辅助识别信息;
通过无线网络将所述音频数据和所述辅助识别信息发送给音频接收装置;
其中,所述音频数据用于一个或多个电子设备执行媒体处理,所述辅助识别信息用于一个或多个电子设备根据所述辅助识别信息从所述音频数据中识别控制指令,所述电子设备为所述音频接收装置或与所述音频接收装置通信连接的其他电子设备。
92.根据权利要求91所述的音频处理方法,其特征在于,所述辅助识别信息包括以下一种或者多种信息:用于指示出控制指令所对应的音频片段的片段标识信息、控制指令所对应的音频数据的类型、控制指令所对应的控制内容信息。
93.根据权利要求92所述的音频处理方法,其特征在于,控制指令所对应的音频数据的类型包括:语音类型和/或非语音类型。
94.根据权利要求91所述的音频处理方法,其特征在于,在将所述音频数据发送给所述音频接收装置之前,所述方法还包括:
对所述音频数据进行编码。
95.根据权利要求94所述的音频处理方法,其特征在于,进行识别处理的音频数据为编码前的音频数据。
96.根据权利要求91所述的音频处理方法,其特征在于,将所述音频数...
【专利技术属性】
技术研发人员:边云锋,莫品西,薛政,刘洋,吴俊峰,
申请(专利权)人:深圳市大疆创新科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。