【技术实现步骤摘要】
一种针对民航陆空通话领域的端到端的自动语音识别方法
本专利技术涉及智能通话、信号处理以及深度学习领域,特别是涉及一种针对民航陆空通话领域的端到端语音识别方法及系统。
技术介绍
随着民航客运、货运业务等迅速扩展,机场飞机活动十分频繁,这给机场空中交通管制员带来了极大的工作压力。因此,我们需要以智能机器辅助管制员进行空中交通管制,以降低空管员工作压力更好地保障机场安全与秩序。进行一切智能辅助的前提是人与机器的智能交互,而最快捷地交互无疑是进行口语交流。因此,本专利技术一种针对民航陆空通话领域的端到端自动语音识别方法功能即将管制员与飞行员交流的通话转写为文字或是信号以输入计算机辅助程序。传统的自动语音识别方法是基于混合高斯模型以及隐马尔科夫模型的,即使是基于深度神经网络的语音识别方法大多数也是需要先训练混合高斯模型以及隐马尔科夫模型以生成对齐文件,并以对齐文件为输入训练深度神经网络模型。这样的语音识别模型训练过程无疑是繁琐的并且耗时耗力,后来随着深度学习不断往端到端模型发展,越来越多的研究者们在图像识别、自然语言处理以及语 ...
【技术保护点】
1.一种针对民航陆空通话领域的端到端自动语音识别方法,其特征在于利用端到端模型建立的适用于民航陆空通话的自动语音识别方法,所述语音识别方法包括:/n以端到端模型为声学模型进行语音识别;/n其中端到端模型的训练方法;/n基于端到端模型的语音识别方法在民航陆空通话领域的应用。/n
【技术特征摘要】
1.一种针对民航陆空通话领域的端到端自动语音识别方法,其特征在于利用端到端模型建立的适用于民航陆空通话的自动语音识别方法,所述语音识别方法包括:
以端到端模型为声学模型进行语音识别;
其中端到端模型的训练方法;
基于端到端模型的语音识别方法在民航陆空通话领域的应用。
2.根据权利要求1所述的语音识别方法,其特征在于使用端到端模型作为语音识别的声学模型,利用所述端到端模型进行语音识别,具体包括:
端到端模型的结构特征在于它是基于时延神经网络结构与长短时记忆单元结构的复合神经网络模型;
特殊结构的上下文相关信息模型,用于统计上下文相关信息;
可选的语言模型,用于统计字词间的出现概率,用于解码过程中音素到字词的映射;
将所述基于端到端模型的声学模型结合上下文相关模型即为所述的端到端语音识别模型,可选的附加语言模型可以进一步提高语音识别效果。
3.根据权利要求1所述的端到端模型训练方法,其特征在于端到端模型是根据最大相关互信息结合免词格方法训练,具体包括:
根据所述最大相关互信息为目标函数训练所述端到端模型;
所述免词格方...
【专利技术属性】
技术研发人员:杨群,周凯,刘绍翰,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。