【技术实现步骤摘要】
本专利技术涉及语音识别,尤其涉及基于强制解码的语言相似性评估方法、语音识别方法及相关设备。
技术介绍
1、在语音识别领域,尽管不同语言在发音结构及表现形式上有所不同,但其高维特征具备相似的分布模式,即不同语言的相似语义具有相近的高维特征。多语言联合训练可以充分借助不同语言之间的内在关系,使多语言深度信息相互促进,互为增强,辅助目标语言语音识别性能提升。研究表明,提升模型对各语言的鉴别能力更有助于多语言语音识别性能的提升,而如何在模型多语言联合训练时引入有效的语言相关知识则是提升其语言鉴别能力的关键。
2、当前,语言信息引入的方法可分为基于先验知识的方法、基于数据驱动的方法以及基于预训练模型的方法。综合来看,基于先验知识的方法需要领域专家的经验和专业知识,虽然有效但成本昂贵,不能适应如今的智能化趋势。基于数据驱动的方法依赖于训练数据,只有具备足够数据量时映射网络才会展示出较好的性能,得到可信的相似性结果,这种数据依赖性导致其适用性不强。基于预训练模型的方法是近几年来的主流方法,但当前研究仅针对语音的语言种类这一被人类规定的显式
...【技术保护点】
1.一种基于强制解码的语言相似性评估方法,其特征在于,包括:
2.根据权利要求1所述的基于强制解码的语言相似性评估方法,其特征在于,所述语言相似性评分的计算公式如下:
3.一种基于语言相似性的语音识别方法,其特征在于,包括:
4.根据权利要求3所述的基于语言相似性的语音识别方法,其特征在于,所述多语言语音识别数据集包括语音数据和语言文本数据;其中,所述语言文本数据主要是由每条语音数据所对应的语言文本构成的。
5.根据权利要求3所述的基于语言相似性的语音识别方法,其特征在于,所述多语言语音模型采用MMS模型。
...
【技术特征摘要】
1.一种基于强制解码的语言相似性评估方法,其特征在于,包括:
2.根据权利要求1所述的基于强制解码的语言相似性评估方法,其特征在于,所述语言相似性评分的计算公式如下:
3.一种基于语言相似性的语音识别方法,其特征在于,包括:
4.根据权利要求3所述的基于语言相似性的语音识别方法,其特征在于,所述多语言语音识别数据集包括语音数据和语言文本数据;其中,所述语言文本数据主要是由每条语音数据所对应的语言文本构成的。
5.根据权利要求3...
【专利技术属性】
技术研发人员:屈丹,刘云鹏,高子涵,郝朝龙,杨绪魁,牛铜,
申请(专利权)人:中国人民解放军网络空间部队信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。