一种基于藏文部件的端到端架构拉萨方言语音识别方法技术

技术编号：21481297 阅读：29 留言：0更新日期：2019-06-29 05:40

本发明专利技术公开一种基于藏文部件的端到端架构拉萨方言语音识别方法,主要步骤包括:首先,端到端语音识别架构；其次，提出了更适合低资源语言在此架构上进行训练的策略，包括以下两点：迁移其他语言性能良好的模型作为初始模型和同语系语言初始化原则；然后是高度压缩的基于藏文部件的声学建模单元；最后是类多语言语音识别的系统融合。本发明专利技术有效的提高其在端到端架构上的语音识别准确率，并利用多语言语音识别的思路进行两种建模单元级别的系统融合以进一步提升性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于藏文部件的端到端架构拉萨方言语音识别方法
本专利技术属于自动语音识别领域，主要是有关提高藏语这种低资源语言的语音识别性能的技术。
技术介绍
语言是文化的载体和传播媒介，因而针对藏语语言的保护性技术也在不断深入。在藏语语系中，主要有三大方言，即拉萨方言、康巴方言和安多方言，其中拉萨方言在三大方言中使用人群范围较广，数目较多。且具有大量历史悠久的经典西藏手稿文件，因此成为影响力最深远的一种。因此以往的关于藏语的语音识别技术也大多集中在这类方言上。目前有关藏语的语音识别技术仍然由于资源匮乏而发展缓慢。现有的研究都集中在传统的语音识别架构上，通过解码器连结声学模型、语言模型和发音词典来进行语音识别系统搭建，构建速度和解码速度较慢，且需要分别提升声学模型和语言模型的性能。而受传统架构的隐马尔科夫模型(HMM)结构与语音的对齐问题所限，现有研究采用的声学模型建模单元都是音素，这是语音识别技术通用的最小建模单元。当前研究未能抓住藏语语言独有特性，来提升语音识别的系统的性能。
技术实现思路
针对藏语这一低资源语言的语音识别，本专利技术旨在直接实现语音的输入与解码识别，去除繁杂的对齐工作与发音词典制作工作，并力求挖掘其本身特性促进技术的持续发展。而目前兴起的端到端架构，有效的简化了语音识别系统的构建过程，并解决了对齐问题。因此，本专利技术将藏语的语音识别迁移到端到端架构，并针对藏文的本身文字组合结构和发音拼读的特性，结合低资源语言这一困难条件，提出了一种基于藏文部件的端到端架构拉萨方言语音识别方法。并在此基础上，进行系统融合以进一步提高识别效果。本专利技术的技术方案是：...

【技术保护点】
1.一种基于藏文部件的端到端架构拉萨方言语音识别方法,其特征在于,具体步骤包括以下四部分：(1)端到端语音识别架构——转换器模型其中，编码器的输入端是语音的声学特征序列，输出是一组中间表达序列；而编码器的输出也正是解码器的输入，根据这组中间表达序列，解码器的输出端给出由建模单元组成的预测结果；(2)针对低资源语言的端到端架构初始化策略提出了更适合低资源语言在此架构上进行训练的策略，包括以下两点：a)迁移其他语言性能良好的模型作为初始模型不采用随机初始化全部模型参数的方式来初始化训练模型，而是使用其他资源丰富的语言先行进行同样规模的模型训练，并测试其性能，将训练完成后的性能良好的模型迁移至低资源语言的端到端架构上作为初始模型开始训练，以代替随机初始化模型；b)同语系语言初始化原则这种原则主要基于上一种策略，提出对初始模型的一项最佳策略，即选用与低资源语言同语系的资源丰富语言作为初始模型的实验对象；(3)高度压缩的基于藏文部件的声学建模单元每个部件都有其特定的发音，且整个藏文字的发音正是基于构成它的每个部件的发音，即：将每个部件的发音按照组合的顺序拼读；(4)类多语言语音识别的系统融合采用...

【技术特征摘要】
1.一种基于藏文部件的端到端架构拉萨方言语音识别方法,其特征在于,具体步骤包括以下四部分：(1)端到端语音识别架构——转换器模型其中，编码器的输入端是语音的声学特征序列，输出是一组中间表达序列；而编码器的输出也正是解码器的输入，根据这组中间表达序列，解码器的输出端给出由建模单元组成的预测结果；(2)针对低资源语言的端到端架构初始化策略提出了更适合低资源语言在此架构上进行训练的策略，包括以下两点：a)迁移其他语言性能良好的模型作为初始模型不采用随机初始化全部模型参数的方式来初始化训练模型，而是使用其他资源丰富的语言先行进行同样规模的模型训练，并测试其性能，将训练完成后的性能良好的模型迁移至低资源语言的端到端架构上作为初始模型开始训练，以代替随机初始化模型；b)同语系语言初始化原则这种原则主要基于上一种策略，提出对初始模型的一项最佳策略，即选用与低资源语言同语系的资源丰富语言作为初始模型的实验对象；(3)高度压缩的基于藏文部件的声学建模...

【专利技术属性】
技术研发人员：党建武，潘立馨，王龙标，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人