语种识别方法、系统、设备及存储介质技术方案

技术编号:40675102 阅读:15 留言:0更新日期:2024-03-18 19:12
本发明专利技术公开了一种语种识别方法、系统、设备及存储介质,该方法包括:获取多语种音频数据集,采用数据混淆方法对多语种音频数据集进行处理;从处理后的多语种音频数据集中提取文本信息和语音信息;将文本信息和语音信息进行融合,得到融合表征信息;根据融合表征信息训练神经网络,得到语种模型;将待识别语种输入语种模型,得到语种类别。本发明专利技术获取包括短时音频数据和场景音频数据的多语种音频数据集,采用数据混淆方法对多语种音频数据集进行处理;将提取的文本信息和语音信息进行融合,将待识别语种输入根据融合表征信息训练得到的语种模型,得到语种类别,提升了语种模型的识别效果和准确率,改善了短时音频识别效果差以及语种混淆的问题。

【技术实现步骤摘要】

本专利技术涉及语种识别,特别涉及一种语种识别方法、系统、设备及存储介质


技术介绍

1、语种识别是指计算机自动判定一段语音信号的语言类别的技术。该技术主要用在多语言语音处理系统的前端,先进行语种分类,再调用对应语言的asr(自动语音识别)模型。机器学习的语种识别系统主要有gmm-ubm(gaussian mixture model-universalbackground model)(声纹识别)、i-vector(线性降维模型)。深度学习时代,各种深度学习架构虽然在不断提升语种识别的性能,但是大大增加了系统复杂度,增加了资源消耗。同时对于语种识别的两个问题,短时语音的语种识别和易混淆的语种识别,仍然不能进行一劳永逸的解决。这主要是由于语言信息属于语音信号中的弱信息,隐藏在语音信号中,需要通过对语音中的信息进行提取和分析才能进行判定。判决结果的好坏强烈地依赖于语音信息段中的相关统计信息,而在短时语音段和高混淆语言任务中,现有方法对这些统计信息的估计缺乏鲁棒性。

2、在现实研究中,大都只使用音频信息进行语种模型的训练,直接进行语种分类,但不能较好解本文档来自技高网...

【技术保护点】

1.一种语种识别方法,其特征在于,所述语种识别方法包括:

2.如权利要求1所述的语种识别方法,其特征在于,所述采用数据混淆方法对所述多语种音频数据集进行处理的步骤包括:

3.如权利要求1所述的语种识别方法,其特征在于,所述从处理后的多语种音频数据集中提取文本信息和语音信息的步骤包括:

4.如权利要求3所述的语种识别方法,其特征在于,所述将所述文本信息和所述语音信息进行融合,得到融合表征信息的步骤包括:

5.一种语种识别系统,其特征在于,所述语种识别系统包括:

6.如权利要求5所述的语种识别系统,其特征在于,所述处理模块,具体用于...

【技术特征摘要】

1.一种语种识别方法,其特征在于,所述语种识别方法包括:

2.如权利要求1所述的语种识别方法,其特征在于,所述采用数据混淆方法对所述多语种音频数据集进行处理的步骤包括:

3.如权利要求1所述的语种识别方法,其特征在于,所述从处理后的多语种音频数据集中提取文本信息和语音信息的步骤包括:

4.如权利要求3所述的语种识别方法,其特征在于,所述将所述文本信息和所述语音信息进行融合,得到融合表征信息的步骤包括:

5.一种语种识别系统,其特征在于,所述语种识别系统包括:

6.如权利要求5所述的语种识别系统,其特征在于,所述处...

【专利技术属性】
技术研发人员:任君杜诗宣郝竹林罗超王清
申请(专利权)人:携程旅游网络技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1