无人机械控制方法、电台语音指令转换方法及装置制造方法及图纸

技术编号：29706489 阅读：22 留言：0更新日期：2021-08-17 14:36

一种无人机械控制方法、电台语音指令转换方法及装置，控制方法包括：通过远场的无线发射电台将麦克风或对讲机采集的电台语音指令信息发送，对接收的电台语音指令进行去噪增强处理，获得增益语音指令频谱；对增益语音指令频谱进行语音信道转换，获得到非电台语音指令；对非电台语音指令进行语音识别，获得文字控制指令；文字控制指令，用于控制无人机械。实现利用远场无线电台传输的电台语音指令，通过接收、去噪增强、信道转换、识别获得可以用于控制无人机械的文字控制指令，以方便对无人机械的控制，使用方便，直接通过语音控制、交互性更强。

全部详细技术资料下载

【技术实现步骤摘要】
无人机械控制方法、电台语音指令转换方法及装置
本专利技术涉及无人机械控制与语音转换识别
，尤其涉及一种无人机械控制方法、电台语音指令转换方法及装置。
技术介绍
随着科技进步及智能技术的发展，各类无人机械越来越多的被开发出来应用到各领域，比如无人机、无人车、无人船等。目前对于无人机械的控制主要有三种方式：方式1：采用手柄控制，这种方式只能做一些简单的控制，例如:上下前后左右控制，而无法使用复杂指令进行控制、也无法实现一对多控制；方式2：通过键盘输入指令控制，这种方式携带和使用均不方便，且在使用手柄控制时候无法使用键盘控制；方式3：通过可视化界面控制、把所有功能做成管理软件，但是开发成本大、使用的学习成本大，且使用手柄控制时候无法使用可视化界面控制。上述这些方式均不能灵活方便的对无人机械进行控制。
技术实现思路
针对上述现有技术不足，本申请提供一种无人机械控制方法、电台语音指令转换方法及装置，应用于无人机械，实现利用远场无线电台传输的电台语音指令，通过接收、去噪增强、信道转换、识别获得可以用于控制无人机械的文字控制指令，以方便对无人机械的控制，使用方便，直接通过语音控制、交互性更强。为了实现本专利技术的目的，拟采用以下方案：一种电台语音指令转换方法，应用于无人机械，包括：对接收的由远场无线电台发送的电台语音指令进行去噪增强处理，获得增益语音指令频谱；对增益语音指令频谱进行语音信道转换，获得到非电台语音指令；对非电台语音指令进...

【技术保护点】
1.一种电台语音指令转换方法，其特征在于，应用于无人机械，包括：/n对接收的由远场无线电台发送的电台语音指令进行去噪增强处理，获得增益语音指令频谱；/n对所述增益语音指令频谱进行语音信道转换，获得到非电台语音指令；/n对所述非电台语音指令进行语音识别，获得文字控制指令；所述文字控制指令，用于控制所述无人机械。/n

【技术特征摘要】
1.一种电台语音指令转换方法，其特征在于，应用于无人机械，包括：
对接收的由远场无线电台发送的电台语音指令进行去噪增强处理，获得增益语音指令频谱；
对所述增益语音指令频谱进行语音信道转换，获得到非电台语音指令；
对所述非电台语音指令进行语音识别，获得文字控制指令；所述文字控制指令，用于控制所述无人机械。

2.根据权利要求1所述的电台语音指令转换方法，其特征在于，去噪增强处理，包括：
将接收的由远场无线电台发送的电台语音指令按预设时间间隔长度分隔成N个小块；N为整数，N等于所述电台语音指令的时长÷预设时间间隔长度；
对所述小块分别进行短时傅里叶变换处理，获得N个第一频谱；
将所述N个第一频谱分别输入语音去噪增强网络中进行处理，获得N个去噪增强频谱；
将所述N个去噪增强频谱组合成一个完整的增益语音指令频谱。

3.根据权利要求2所述的电台语音指令转换方法，其特征在于，所述语音去噪增强网络，包括7层CNN网络、1层LSTM网络、2层DNN网络；
所述第一频谱具有第一预设频谱宽度；
通过所述语音去噪增强网络对每个第一频谱进行处理的步骤包括：
通过7层CNN网络对一个第一频谱进行去噪增强处理，获得多个具有第一预设频谱宽度的第二频谱；
通过1层LSTM网络对所述多个第二频谱进行去噪增强处理，获得一个具有第二预设频谱宽度的第三频谱；
通过2层DNN网络对所述一个第三频谱进行去噪增强处理，获得一个去噪增强频谱，所述去噪增强频谱具有第一预设频谱宽度。

4.根据权利要求1所述的电台语音指令转换方法，其特征在于，对所述增益语音指令频谱进行语音信道转换，是将所述增益语音指令频谱输入信道转换网络进行信道转换，以获得到非电台语音指令；所述信道转换网络，包括3层残差网络；
进行信道转换的步骤包括：
通过第1层残差网络对输入第1层残差网络的增益语音指令频谱进行处理，输出多个具有第一预设频谱宽度的第一转换音频；
通过第2层残差网络对输入第2层残差网络的增益语音指令频谱、第一转换音频进行结合处理，输出多个具有第一预设频谱宽度的第二转换音频；
通过第3层残差网络对输入第3层残差网络的增益语音指令频谱、第一转换音频、第二转换音频进行结合处理，输出一个具有第一预设频谱宽度的非电台语音指令。

5.根据权利要求1所述的电台语音指令转换方法，其特征在于，对所述非电台语音指令进行语音识别，获得文字控制指令，包括：
判断所述非电台语音指令的时间长度与第一预设时间长度的大小：
若所述非电台语音指令的时间长度小于所述第一预设时间长度，则对所述非电台语音指令进行补0操作，以使所述非电台语音指令的时间长度与所述第一预设时间长度匹配，然后输入语音识别网络进行语音识别；
若所述非电台语音指令的时间长度等于所述第一预设时间长度，则直接输入语音识别网络进行语音识别；
若所述非电台语音指令的时间长度大于所述第一预设时间长度...

【专利技术属性】
技术研发人员：陈英爽，鲍捷，吕春，
申请(专利权)人：成都傅立叶电子科技有限公司，深圳市特发信息股份有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人