一种基于神经网络的语种识别方法、装置及电子设备制造方法及图纸

技术编号:30024667 阅读:20 留言:0更新日期:2021-09-11 06:52
本发明专利技术属于数据信息处理技术领域,提供一种基于神经网络的语种识别方法、装置、电子设备和记录介质,方法包括:接收用户输入的音频数据,对所述音频数据进行特征提取;将所述特征提取的数据发送至语种识别模型,得到候选语种第一概率值,选取排名靠前的n个候选语种;将所述音频数据以及靠前的n个候选语种发送至语种确定模型,得到n个候选语种的第二概率值,根据n个候选语种的第二概率值确定所述音频数据所使用的语种。采用本发明专利技术的技术方案提高了语种识别的准确度,使得智能招聘系统更加完善。使得智能招聘系统更加完善。使得智能招聘系统更加完善。

【技术实现步骤摘要】
一种基于神经网络的语种识别方法、装置及电子设备


[0001]本专利技术属于数据信息处理
,更具体的是涉及一种基于神经网络的语种识别方法、装置及电子设备。

技术介绍

[0002]在传统的招聘面试中常常是通过线下面对面的方式与应聘者进行交流。随着互联网技术的发展,现在越来越多的公司采用线上智能招聘系统与应聘者进行交互方式进行招聘面试。采用智能招聘系统面试的过程中,会有很多问题需要应聘者通过语音的方式进行回答。
[0003]在面试者通过语音进行回答的时候,很可能会切换语种进行回答,比如常见的中英文混合的方式。而现有技术通常是基于语音特征来判断语种并进行识别。但很多人的非母语的口语很差,使得非母语的发音方式常常接近母语,这种情况下很大概率会判断错语种,使得后续语音和文字转换过程中出现问题,导致面试结果存在很大偏差。

技术实现思路

[0004](一)要解决的技术问题
[0005]本专利技术旨在解决现有智能招聘系统中进行语音识别时,无法准确识别说话中途语种切换的语音的问题。
[0006](二)技术方案
[0007]为解决上述技术问题,本专利技术的第一方面提出一种基于神经网络的语种识别方法,包括:
[0008]接收用户输入的音频数据,对所述音频数据进行特征提取;
[0009]将所述特征提取的数据发送至语种识别模型,得到候选语种第一概率值,选取排名靠前的n个候选语种,其中n为自然数;
[0010]将所述音频数据以及靠前的n个候选语种发送至语种确定模型,得到n个候选语种的第二概率值,根据n个候选语种的第二概率值确定所述音频数据所使用的语种。
[0011]根据本专利技术的优选实施方式,对所述音频数据进行特征提取具体为:对所述音频数据提取梅尔频率倒谱系数特征或梅尔滤波器组特征。
[0012]根据本专利技术的优选实施方式,将所述特征提取的数据发送至语种识别模型之前,还将所述特征提取的数据发送至切换判断模型。
[0013]根据本专利技术的优选实施方式,所述切换判断模型,以帧为单位判断语种是否发生了切换,得到所述音频信息语种切换次数,语种切换种类以及对应的持续时间。
[0014]根据本专利技术的优选实施方式,将所述音频数据以及靠前的n个候选语种发送语种确定模型,得到n个候选语种的第二概率值具体为:
[0015]根据所述音频数据以及靠前的n个候选语种确定n个候选语种的混淆度得分;
[0016]根据n个候选语种的第一概率值确定神经网络分数;
[0017]对所述n个候选语种的混淆度得分和神经网络分数加权求和,得到所述n个候选语种的第二概率值。
[0018]根据本专利技术的优选实施方式,确定n个候选语种的混淆度得分具体为:
[0019]将所述音频数据以及靠前的n个候选语种发送至识别引擎,转写出n个候选语种的文本,根据所述n个语种的文本计算n个候选语种的混淆度得分。
[0020]根据本专利技术的优选实施方式,所述神经网络分数为n个候选语种的后验概率值。
[0021]本专利技术第二方面提出一种基于神经网络的语种识别装置,包括:
[0022]特征提取模块,用于接收用户输入的音频数据,对所述音频数据进行特征提取;
[0023]语种识别模块,用于将所述特征提取的数据发送至语种识别模型,得到候选语种第一概率值,选取排名靠前的n个候选语种,其中n为自然数;
[0024]语种确定模块,用于将所述音频数据以及靠前的n个候选语种发送至语种确定模型,得到n个候选语种的第二概率值,根据n个候选语种的第二概率值确定所述音频数据所使用的语种。
[0025]根据本专利技术的优选实施方式,对所述音频数据进行特征提取具体为:对所述音频数据提取梅尔频率倒谱系数特征或梅尔滤波器组特征。
[0026]根据本专利技术的优选实施方式,将所述特征提取的数据发送至语种识别模型之前,还将所述特征提取的数据发送至切换判断模型。
[0027]根据本专利技术的优选实施方式,所述切换判断模型,以帧为单位判断语种是否发生了切换,得到所述音频信息语种切换次数,语种切换种类以及对应的持续时间。
[0028]根据本专利技术的优选实施方式,将所述音频数据以及靠前的n个候选语种发送语种确定模型,得到n个候选语种的第二概率值具体为:
[0029]根据所述音频数据以及靠前的n个候选语种确定n个候选语种的混淆度得分;
[0030]根据n个候选语种的第一概率值确定神经网络分数;
[0031]对所述n个候选语种的混淆度得分和神经网络分数加权求和,得到所述n个候选语种的第二概率值。
[0032]根据本专利技术的优选实施方式,确定n个候选语种的混淆度得分具体为:
[0033]将所述音频数据以及靠前的n个候选语种发送至识别引擎,转写出n个候选语种的文本,根据所述n个语种的文本计算n个候选语种的混淆度得分。
[0034]根据本专利技术的优选实施方式,所述神经网络分数为n个候选语种的后验概率值。
[0035]本专利技术第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。
[0036]本专利技术第四方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
[0037](三)有益效果
[0038]本专利技术通过计算语音数据对应文本的混淆度得分和神经网络分数最终确定语音数据中使用语种信息,提高了语种识别的准确度,使得智能招聘系统更加完善。
附图说明
[0039]图1是本专利技术的一个实施例的一种基于神经网络的语种识别方法流程示意图;
[0040]图2是本专利技术的一个实施例一的流程示意图;
[0041]图3是本专利技术的一个实施例的一种基于神经网络的语种识别装置结构示意图;
[0042]图4是本专利技术的一个实施例的电子设备的结构示意图;
[0043]图5是本专利技术的一个实施例的计算机可读记录介质的示意图。
具体实施方式
[0044]在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本专利技术。
[0045]附图中的流程图仅是一种示例性的流程演示,不代表本专利技术的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本专利技术的专利技术主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
[0046]附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的语种识别方法,其特征在于,方法包括:接收用户输入的音频数据,对所述音频数据进行特征提取;将所述特征提取的数据发送至语种识别模型,得到候选语种第一概率值,选取排名靠前的n个候选语种,其中n为自然数;将所述音频数据以及靠前的n个候选语种发送至语种确定模型,得到n个候选语种的第二概率值,根据n个候选语种的第二概率值确定所述音频数据所使用的语种。2.如权利要求1所述的基于神经网络的语种识别方法,其特征在于,对所述音频数据进行特征提取具体为:对所述音频数据提取梅尔频率倒谱系数特征或梅尔滤波器组特征。3.如权利要求1所述的基于神经网络的语种识别方法,其特征在于,将所述特征提取的数据发送至语种识别模型时,还将所述特征提取的数据发送至切换判断模型。4.如权利要求3所述的基于神经网络的语种识别方法,其特征在于,所述切换判断模型,以帧为单位判断语种是否发生了切换,得到所述音频信息语种切换次数,语种切换种类以及对应的持续时间。5.如权利要求3所述的基于神经网络的语种识别方法,其特征在于,将所述音频数据以及靠前的n个候选语种发送语种确定模型,得到n个候选语种的第二概率值具体为:根据所述音频数据以及靠前的n个候选语种确定n个候选语种的混淆度得分;根据n个候选语种的第一概率值确定神经网络分数;对所述n个候选语种的混淆度得分和神经网络分数加权求和,得到所述n个候选语种的第二概率值。6.如权利要求5所述的基于神经网络的语种识别方法,其特征在于,确定n个候选语种的混淆度得分具体为:将所述音频数据以及靠前的n个候选语种发送至识别引擎,转写出n个候选语种的文本,根据所述n个语种的文本计算n个候选语种的混淆度得分。7.如权利要求5所述的基于神经网络的语种识别方法,其特征在于,所述神经网络分数为n个候选语种的后验概率值。8.一种基于神经网络的语种识别装置,其特征在于,装置包括:特征提取模块,用于接收用户输入的音频数据,对所述音频数据进行特征提取;语种识别模块,用于将所述特征提取的数据发送至语种识别模型,得到候选语种第一概率值,选取排名靠前的n个候选...

【专利技术属性】
技术研发人员:陈昊昕
申请(专利权)人:上海才历网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1