一种针对民航陆空通话领域的基于迁移学习的语音识别方法技术

技术编号:26847550 阅读:26 留言:0更新日期:2020-12-25 13:12
本发明专利技术公开一种针对民航陆空通话领域的基于迁移学习的语音识别方法。方法包括:收集通用数据集和迁移数据集并做数据处理;初始化神经网络,采用时延神经网络‑隐马尔可夫模型作为声学训练模型;使用通用数据集进行语音识别训练,得到中文语音识别通用声学模型;对所述迁移数据集在通用中文语音识别模型上进行训练并调整参数,得到民航陆空通话领域中文语音识别声学模型;扩充民航领域文本语料,生成语言模型。发明专利技术的基于迁移学习的方法能有效利用该领域外的数据,相较于普通声学模型识别效果有很大提高。采用本发明专利技术的方法能够解决民航陆空通话领域中文语料不足的问题,提高民航陆空通话的准确性。

【技术实现步骤摘要】
一种针对民航陆空通话领域的基于迁移学习的语音识别方法
本专利技术涉及迁移学习领域,特别是涉及一种针对民航陆空通话领域的基于迁移学习的语音识别方法。
技术介绍
近年来,国民经济的发展促进了我国民航事业不断发展,在航班数量明显增加的同时也对民航安全提出了新的考验。民航陆空对话作为飞行员与空中交通管制员(后简称“管制员”)一种重要的通信方式,得到了前所未有的重视。从民航陆空对话方式来看,在现役的民航通信设备的基础上,为使航空器安全、高效地运行,管制员和飞行员必须准确、清晰地理解双方的语音意图,从而保证导航指令准确无误地得到传递。因此,长期以来,管制员指令下达标准与否以及管制员和飞行员之间的地空语音对话内容是否相互一致是一个直接关系航空器的飞行安全的重大问题。如何更好的保持地空对话,也成为关系民航事业发展的关键一步。在所有民航事故中,由于陆空对话失误产生的安全事故举不胜举。例如2010年发生在德国的的乌伯林根空难,该次空难共造成71人死亡。事故调查结果显示,导致此次空难发生的最主要原因是陆空对话错误,具体包括用语不规范、飞行员理解失误等方面。在本文档来自技高网...

【技术保护点】
1.一种针对民航陆空通话领域的基于迁移学习的语音识别方法,所述方法包括:/n收集通用数据集和迁移数据集并做数据处理;/n初始化神经网络,采用时延神经网络-隐马尔可夫模型作为声学训练模型;/n使用通用数据集进行语音识别训练,得到中文语音识别通用模型;/n对所述迁移数据集在通用中文语音识别模型上进行训练并调整参数,得到民航陆空通话领域中文语音识别模型;/n扩充民航领域文本语料,生成语言模型;/n

【技术特征摘要】
1.一种针对民航陆空通话领域的基于迁移学习的语音识别方法,所述方法包括:
收集通用数据集和迁移数据集并做数据处理;
初始化神经网络,采用时延神经网络-隐马尔可夫模型作为声学训练模型;
使用通用数据集进行语音识别训练,得到中文语音识别通用模型;
对所述迁移数据集在通用中文语音识别模型上进行训练并调整参数,得到民航陆空通话领域中文语音识别模型;
扩充民航领域文本语料,生成语言模型;


2.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于收集通用数据集和迁移数据集并做数据处理,具体包括:
获取通用中文语音数据集并做数据风格迁移作为训练数据集;
获取民航陆空通话领域中文语音数据集作为迁移训练数据集;
对所述训练数据集和迁移训练数据集进行指定特征提取,并对所述数据转换得到特征向量;


3.根据权利要求1所述的针对民航陆空通话领域的基于迁移学习的语音识别方法,其特征在于从预训练模型和目标模型中找到共享的参数信息,以实现模型迁移,具体包括:
给出训练集来...

【专利技术属性】
技术研发人员:杨群孙修松刘绍翰
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1