一种引入外部数据校正的空中管制语音识别方法技术

技术编号：24414272 阅读：25 留言：0更新日期：2020-06-06 10:42

本发明专利技术公开了一种引入外部数据校正的空中管制语音识别方法，包含数据预处理模块、语音识别模型和外部数据校正模型；数据预处理模块将原始语音数据和外部信息数据（航班列表）转化为输入语音识别模型和外部数据校正模型的数据；语音识别模型包含深度残差卷积模块、深度残差序列学习模块和全连接层，预处理后的语音信号依次经深度残差卷积模块、深度残差序列学习模块、全连接层生成多层次语音通道信息特征、高层次特征序列、文字序列。外部数据校正模型将预处理后的外部信息数据与语音识别模型中的高层次序列特征数据相融合，通过注意力机制计算语音中的航班号以校正语音识别结果中的航班号，从而提高语音识别准确率和航班号识别准确率。

An air traffic control speech recognition method with external data correction

全部详细技术资料下载

【技术实现步骤摘要】
一种引入外部数据校正的空中管制语音识别方法
本专利技术属于信息处理领域，具体涉及一种引入外部数据校正的空中管制语音识别方法。
技术介绍
中国民航业发展迅速，然而空中管制人员缺口较大，且人员流失现象严重，导致现有空管人员工作负荷大，易引发空中交通潜在的效率问题和安全问题。当前中国空中交通管制以空管员主观决策进行指挥，人为失误无法避免。据统计，航空事故总量的80%是人为差错所引起的，是影响目前航空安全的重要因素。因此有必要采用自动语音识别系统辅助空管员发送指令、接收与记录飞行员的回复语音，从而减少漏听、遗忘和理解歧义等情况。在空管语音的识别方面，由于空管语音含有大量专业术语，以及语速和口音多变等特点，通用语音识别模型的识别准确率很低，需要采用专门的模型和训练方法。2016年，桂林市晶准测控技术有限公司采用预训练的空管语音库进行语音识别，这种方法受到语音数据库的限制，对不完全匹配规则的语音识别效果较差，准确率较低。2018年，中国电子科技集团十五所搭建了基于连续隐马尔科夫CHMM的声学模型，这种模型的识别准确率显著低于深度学习模型；中国民航大学构建了特征增强的DNN-HMM模型，能够在一定程度上提高识别准确率，但是DNN容易产生过拟合和陷于局部最优等缺点，其识别准确率明显低于CNN-GRU神经网络模型。2019年，上海麦图信息科技有限公司构建了CNN-GRU-CTC结构的空管语音识别模型，识别准确率较高，然而其模型复杂度仍有待进一步提高，识别准确率仍有上升空间。同时，当前的空管语音识别只有语音识别的功能，而在实际应...

【技术保护点】
1.一种引入外部数据校正的空中管制语音识别方法，其特征是：包括数据预处理模块、语音识别模型、外部数据校正模型，其语音识别方法如下：/nS1：通过数据预处理模块中的语谱图转换器和词嵌入层，分别将原始语音数据和外部信息数据（航班列表）转换成可输入语音识别模型和外部数据校正模型的语谱图和词向量；/nS2：语谱图数据进入语音识别模型，先通过深度残差卷积模块生成多层次语音通道信息特征，再通过深度残差序列学习模块生成高层次特征序列，最后通过全连接层生成文字序列（含航班号）；/nS3：词向量数据和语音识别模型中的高层次特征序列数据同时进入外部数据校正模型，通过注意力机制计算语音中的航班号；/nS4：语音识别模型所得的文字序列（含航班号）进入外部数据校正模型，与注意力机制所计算的航班号相对比，经过航班号校正过程后，获得最终的语音识别结果。/n

【技术特征摘要】
1.一种引入外部数据校正的空中管制语音识别方法，其特征是：包括数据预处理模块、语音识别模型、外部数据校正模型，其语音识别方法如下：
S1：通过数据预处理模块中的语谱图转换器和词嵌入层，分别将原始语音数据和外部信息数据（航班列表）转换成可输入语音识别模型和外部数据校正模型的语谱图和词向量；
S2：语谱图数据进入语音识别模型，先通过深度残差卷积模块生成多层次语音通道信息特征，再通过深度残差序列学习模块生成高层次特征序列，最后通过全连接层生成文字序列（含航班号）；
S3：词向量数据和语音识别模型中的高层次特征序列数据同时进入外部数据校正模型，通过注意力机制计算语音中的航班号；
S4：语音识别模型所得的文字序列（含航班号）进入外部数据校正模型，与注意力机制所计算的航班号相对比，经过航班号校正过程后，获得最终的语音识别结果。

2.根据权利要求1所述的引入外部数据校正的空中管制语音识别方法，其特征在于，所述的数据预处理模块，其数据处理包括如下步骤：
S1.1：原始语音数据进入数据预处理模块中的语谱图转换器，先后经过分帧、加窗以及短时傅里叶变换后，获得相应的语谱图数据；
S1.2：外部信息数据（航班列表）进入数据预处理模块中的词嵌入层，生成相应的词向量数据。

3.根据权利要求1所述的引入外部数据校正的空中管制语音识别方法，其特征在于，所述的语音识别模型...

【专利技术属性】
技术研发人员：王耀彬，李鑫，
申请(专利权)人：上海麦图信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人