无人机械控制方法、电台语音指令转换方法及装置制造方法及图纸

技术编号:29706489 阅读:22 留言:0更新日期:2021-08-17 14:36
一种无人机械控制方法、电台语音指令转换方法及装置,控制方法包括:通过远场的无线发射电台将麦克风或对讲机采集的电台语音指令信息发送,对接收的电台语音指令进行去噪增强处理,获得增益语音指令频谱;对增益语音指令频谱进行语音信道转换,获得到非电台语音指令;对非电台语音指令进行语音识别,获得文字控制指令;文字控制指令,用于控制无人机械。实现利用远场无线电台传输的电台语音指令,通过接收、去噪增强、信道转换、识别获得可以用于控制无人机械的文字控制指令,以方便对无人机械的控制,使用方便,直接通过语音控制、交互性更强。

【技术实现步骤摘要】
无人机械控制方法、电台语音指令转换方法及装置
本专利技术涉及无人机械控制与语音转换识别
,尤其涉及一种无人机械控制方法、电台语音指令转换方法及装置。
技术介绍
随着科技进步及智能技术的发展,各类无人机械越来越多的被开发出来应用到各领域,比如无人机、无人车、无人船等。目前对于无人机械的控制主要有三种方式:方式1:采用手柄控制,这种方式只能做一些简单的控制,例如:上下前后左右控制,而无法使用复杂指令进行控制、也无法实现一对多控制;方式2:通过键盘输入指令控制,这种方式携带和使用均不方便,且在使用手柄控制时候无法使用键盘控制;方式3:通过可视化界面控制、把所有功能做成管理软件,但是开发成本大、使用的学习成本大,且使用手柄控制时候无法使用可视化界面控制。上述这些方式均不能灵活方便的对无人机械进行控制。
技术实现思路
针对上述现有技术不足,本申请提供一种无人机械控制方法、电台语音指令转换方法及装置,应用于无人机械,实现利用远场无线电台传输的电台语音指令,通过接收、去噪增强、信道转换、识别获得可以用于控制无人机械的文字控制指令,以方便对无人机械的控制,使用方便,直接通过语音控制、交互性更强。为了实现本专利技术的目的,拟采用以下方案:一种电台语音指令转换方法,应用于无人机械,包括:对接收的由远场无线电台发送的电台语音指令进行去噪增强处理,获得增益语音指令频谱;对增益语音指令频谱进行语音信道转换,获得到非电台语音指令;对非电台语音指令进行语音识别,获得文字控制指令;文字控制指令,用于控制无人机械。进一步,由远场无线电台发送的电台语音指令,是在远场处通过麦克风或对讲机采集的、并由远场无线电台发送的电台语音指令。进一步,去噪增强处理,包括:将接收的由远场无线电台发送的电台语音指令按预设时间间隔长度分隔成N个小块;N为整数,等于电台语音指令的时长÷预设时间间隔长度;对小块分别进行短时傅里叶变换处理,获得N个第一频谱;将N个第一频谱分别输入语音去噪增强网络中进行处理,获得N个去噪增强频谱;将N个去噪增强频谱组合成一个完整的增益语音指令频谱。进一步,语音去噪增强网络,包括7层CNN网络、1层LSTM网络、2层DNN网络;第一频谱具有第一预设频谱宽度;通过语音去噪增强网络对每个第一频谱进行处理的步骤包括:通过7层CNN网络对一个第一频谱进行去噪增强处理,获得多个具有第一预设频谱宽度的第二频谱;通过1层LSTM网络对多个第二频谱进行去噪增强处理,获得一个具有第二预设频谱宽度的第三频谱;通过2层DNN网络对一个第三频谱进行去噪增强处理,获得一个去噪增强频谱,去噪增强频谱具有第一预设频谱宽度。进一步,对增益语音指令频谱进行语音信道转换,是将增益语音指令频谱输入信道转换网络进行信道转换,以获得到非电台语音指令;信道转换网络,包括3层残差网络;进行信道转换的步骤包括:通过第1层残差网络对输入第1层残差网络的增益语音指令频谱进行处理,输出多个具有第一预设频谱宽度的第一转换音频;通过第2层残差网络对输入第2层残差网络的增益语音指令频谱、第一转换音频进行结合处理,输出多个具有第一预设频谱宽度的第二转换音频;通过第3层残差网络对输入第3层残差网络的增益语音指令频谱、第一转换音频、第二转换音频进行结合处理,输出一个具有第一预设频谱宽度的非电台语音指令。进一步,对非电台语音指令进行语音识别,获得文字控制指令,包括:判断非电台语音指令的时间长度与第一预设时间长度的大小:若非电台语音指令的时间长度小于第一预设时间长度,则对非电台语音指令进行补0操作,以使非电台语音指令的时间长度与第一预设时间长度匹配,然后输入语音识别网络进行语音识别;若非电台语音指令的时间长度等于第一预设时间长度,则直接输入语音识别网络进行语音识别;若非电台语音指令的时间长度大于第一预设时间长度,则对非电台语音指令进行切割,切割为若干与第一预设时间长度匹配的第一非电台语音指令块,以及至多一个小于第一预设时间长度的第二非电台语音指令块,将第二非电台语音指令块进行补0操作,以使第二非电台语音指令块与第一预设时间长度匹配,然后将第一非电台语音指令块以及补0操作后的第二非电台语音指令块输入语音识别网络进行语音识别。进一步,语音识别网络,包括5层CNN网络、1层BLSTM网络、2层DNN网络、CTC解码网络;语音识别网络进行语音识别的步骤包括:通过5层CNN网络对输入的语音识别网络的非电台语音指令,或第一非电台语音指令块与第二非电台语音指令块进行特征提取处理,获得具有第二预设时间长度和第三预设频谱宽度的第一识别频谱块;通过1层BLSTM网络对第一识别频谱块进行特征提取处理,获得具有第二预设时间长度和第四预设频谱宽度的第二识别频谱块;通过第1层DNN网络对第二识别频谱块进行特征提取,获得具有第一长度和第一宽度的特征向量;通过第2层DNN网络对特征向量进行分类,获得具有第一长度和第二宽度的文字识别结果;通过CTC解码网络对文字识别结果进行转换,输出大于等于0个汉字,以获得文字控制指令。一种电台语音指令转换装置,设于无人机械,包括:语音去噪增强模块,用于对接收的由远场无线电台发送的电台语音指令进行去噪增强处理,获得增益语音指令频谱;语音信道转换模块,用于对增益语音指令频谱进行语音信道转换,获得到非电台语音指令;语音识别模块,用于对非电台语音指令进行语音识别,获得文字控制指令,文字控制指令,用于控制无人机械。一种无人机械控制方法,其特征在于,包括:通过远场的无线发射电台将麦克风或对讲机采集的电台语音指令信息发送;通过设于无人机械的无线接收电台接收无线发射电台发送的电台语音指令;通过设于无人机械的语音去噪增强模块对电台语音指令进行去噪增强处理,获得增益语音指令频谱;通过设于无人机械的语音信道转换模块对增益语音指令频谱进行语音信道转换,获得到非电台语音指令;通过设于无人机械的语音识别模块对非电台语音指令进行语音识别,获得文字控制指令;根据文字控制指令控制无人机械。本专利技术的有益效果:1、可以将远场电台无线发送的电台语音控制指令转换为用于控制无人机械的文字指令,能够方便对无人机械进行远程控制,使用方便,实现了直接通过语音控制、交互性跟强。2、采用基于神经网络的方式进行去噪增强处理、信道转换处理以及语音识别处理,可以确保语音控制的识别效果精准有效,使识别获得的文字指令能够正确表达传输语音指令者的控制意愿。3、现有的识别模型主要采样训练加噪音方式来处理噪音问题,对于信噪比大于0db以为语音,识别率较高能到97%,但对于信噪比小于0db的语音,识别率较低,低于70%;本专利技术采用分割小块,并进行短时傅里叶变换,然后利用7层CNN网络+1层LS本文档来自技高网...

【技术保护点】
1.一种电台语音指令转换方法,其特征在于,应用于无人机械,包括:/n对接收的由远场无线电台发送的电台语音指令进行去噪增强处理,获得增益语音指令频谱;/n对所述增益语音指令频谱进行语音信道转换,获得到非电台语音指令;/n对所述非电台语音指令进行语音识别,获得文字控制指令;所述文字控制指令,用于控制所述无人机械。/n

【技术特征摘要】
1.一种电台语音指令转换方法,其特征在于,应用于无人机械,包括:
对接收的由远场无线电台发送的电台语音指令进行去噪增强处理,获得增益语音指令频谱;
对所述增益语音指令频谱进行语音信道转换,获得到非电台语音指令;
对所述非电台语音指令进行语音识别,获得文字控制指令;所述文字控制指令,用于控制所述无人机械。


2.根据权利要求1所述的电台语音指令转换方法,其特征在于,去噪增强处理,包括:
将接收的由远场无线电台发送的电台语音指令按预设时间间隔长度分隔成N个小块;N为整数,N等于所述电台语音指令的时长÷预设时间间隔长度;
对所述小块分别进行短时傅里叶变换处理,获得N个第一频谱;
将所述N个第一频谱分别输入语音去噪增强网络中进行处理,获得N个去噪增强频谱;
将所述N个去噪增强频谱组合成一个完整的增益语音指令频谱。


3.根据权利要求2所述的电台语音指令转换方法,其特征在于,所述语音去噪增强网络,包括7层CNN网络、1层LSTM网络、2层DNN网络;
所述第一频谱具有第一预设频谱宽度;
通过所述语音去噪增强网络对每个第一频谱进行处理的步骤包括:
通过7层CNN网络对一个第一频谱进行去噪增强处理,获得多个具有第一预设频谱宽度的第二频谱;
通过1层LSTM网络对所述多个第二频谱进行去噪增强处理,获得一个具有第二预设频谱宽度的第三频谱;
通过2层DNN网络对所述一个第三频谱进行去噪增强处理,获得一个去噪增强频谱,所述去噪增强频谱具有第一预设频谱宽度。


4.根据权利要求1所述的电台语音指令转换方法,其特征在于,对所述增益语音指令频谱进行语音信道转换,是将所述增益语音指令频谱输入信道转换网络进行信道转换,以获得到非电台语音指令;所述信道转换网络,包括3层残差网络;
进行信道转换的步骤包括:
通过第1层残差网络对输入第1层残差网络的增益语音指令频谱进行处理,输出多个具有第一预设频谱宽度的第一转换音频;
通过第2层残差网络对输入第2层残差网络的增益语音指令频谱、第一转换音频进行结合处理,输出多个具有第一预设频谱宽度的第二转换音频;
通过第3层残差网络对输入第3层残差网络的增益语音指令频谱、第一转换音频、第二转换音频进行结合处理,输出一个具有第一预设频谱宽度的非电台语音指令。


5.根据权利要求1所述的电台语音指令转换方法,其特征在于,对所述非电台语音指令进行语音识别,获得文字控制指令,包括:
判断所述非电台语音指令的时间长度与第一预设时间长度的大小:
若所述非电台语音指令的时间长度小于所述第一预设时间长度,则对所述非电台语音指令进行补0操作,以使所述非电台语音指令的时间长度与所述第一预设时间长度匹配,然后输入语音识别网络进行语音识别;
若所述非电台语音指令的时间长度等于所述第一预设时间长度,则直接输入语音识别网络进行语音识别;
若所述非电台语音指令的时间长度大于所述第一预设时间长度...

【专利技术属性】
技术研发人员:陈英爽鲍捷吕春
申请(专利权)人:成都傅立叶电子科技有限公司深圳市特发信息股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1