【技术实现步骤摘要】
本专利技术涉及语种识别,特别涉及一种语种识别方法、系统、设备及存储介质。
技术介绍
1、语种识别是指计算机自动判定一段语音信号的语言类别的技术。该技术主要用在多语言语音处理系统的前端,先进行语种分类,再调用对应语言的asr(自动语音识别)模型。机器学习的语种识别系统主要有gmm-ubm(gaussian mixture model-universalbackground model)(声纹识别)、i-vector(线性降维模型)。深度学习时代,各种深度学习架构虽然在不断提升语种识别的性能,但是大大增加了系统复杂度,增加了资源消耗。同时对于语种识别的两个问题,短时语音的语种识别和易混淆的语种识别,仍然不能进行一劳永逸的解决。这主要是由于语言信息属于语音信号中的弱信息,隐藏在语音信号中,需要通过对语音中的信息进行提取和分析才能进行判定。判决结果的好坏强烈地依赖于语音信息段中的相关统计信息,而在短时语音段和高混淆语言任务中,现有方法对这些统计信息的估计缺乏鲁棒性。
2、在现实研究中,大都只使用音频信息进行语种模型的训练,直接进行语
...【技术保护点】
1.一种语种识别方法,其特征在于,所述语种识别方法包括:
2.如权利要求1所述的语种识别方法,其特征在于,所述采用数据混淆方法对所述多语种音频数据集进行处理的步骤包括:
3.如权利要求1所述的语种识别方法,其特征在于,所述从处理后的多语种音频数据集中提取文本信息和语音信息的步骤包括:
4.如权利要求3所述的语种识别方法,其特征在于,所述将所述文本信息和所述语音信息进行融合,得到融合表征信息的步骤包括:
5.一种语种识别系统,其特征在于,所述语种识别系统包括:
6.如权利要求5所述的语种识别系统,其特征在于,所
...【技术特征摘要】
1.一种语种识别方法,其特征在于,所述语种识别方法包括:
2.如权利要求1所述的语种识别方法,其特征在于,所述采用数据混淆方法对所述多语种音频数据集进行处理的步骤包括:
3.如权利要求1所述的语种识别方法,其特征在于,所述从处理后的多语种音频数据集中提取文本信息和语音信息的步骤包括:
4.如权利要求3所述的语种识别方法,其特征在于,所述将所述文本信息和所述语音信息进行融合,得到融合表征信息的步骤包括:
5.一种语种识别系统,其特征在于,所述语种识别系统包括:
6.如权利要求5所述的语种识别系统,其特征在于,所述处...
【专利技术属性】
技术研发人员:任君,杜诗宣,郝竹林,罗超,王清,
申请(专利权)人:携程旅游网络技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。