一种模型更新方法及装置制造方法及图纸

技术编号:28298115 阅读:30 留言:0更新日期:2021-04-30 16:24
本申请提供一种模型更新方法及装置,应用于语音识别领域,其中,应用于设备端的方法包括:获取语音数据;利用部署在本地的语音检测模型对语音数据进行检测,以判断语音数据为第一类型语音或者第二类型语音;根据判断结果确定语音数据对应的标签,并存储语音数据以及标签作为样本数据,以根据样本数据对语音检测模型以及部署在服务器上的语音通用活体检测模型进行更新。在上述方案中,由于设备端采集的训练样本包含使用场景以及说话人的特性,因此,利用上述训练样本对模型训练可以得到更适应当前使用环境、识别率更强的语音检测模型。

【技术实现步骤摘要】
一种模型更新方法及装置
本申请涉及语音识别领域,具体而言,涉及一种模型更新方法及装置。
技术介绍
随着语音技术的发展,越来越多的智能设备上搭载了语音功能,如:语音识别、声纹识别、声纹认证、语音转录等,而针对语音功能的攻击方式也随之层出不穷。现有技术中,为了识别针对语音功能的攻击,设备厂商会在智能设备上部署语音检测模型,通过语音检测模型实现对针对语音功能的攻击的检测。但是,设备厂商统一训练的通用模型缺乏对不同使用环境或不同说话人的足够泛化性,在训练数据未涵盖到的场景下可能出现模型性能欠佳的情况。也就是说,现有技术中设备厂商部署在智能设备上的语音通用检测模型的识别率较低。
技术实现思路
本申请实施例的目的在于提供一种模型更新方法及装置,用以解决设备厂商部署在智能设备上的语音通用检测模型的识别率较低的技术问题。为了实现上述目的,本申请实施例所提供的技术方案如下所示:第一方面,本申请实施例提供一种模型更新方法,应用于设备端,包括:获取语音数据;利用部署在本地的语音检测模型对所述语音数据进行检测,以判断所述语音数据为第一类型语音或者第二类型语音;根据判断结果确定所述语音数据对应的标签,并存储所述语音数据以及所述标签作为样本数据,以根据所述样本数据对所述语音检测模型以及部署在服务器上的语音通用活体检测模型进行更新。在上述方案中,设备端在部署语音检测模型之后,会采集该语音检测模型检测的语音数据以及对应的检测结果作为训练样本,进一步的对本地的语音检测模型以及服务器的语音通用活体检测模型进行更新。由于设备端采集的训练样本包含使用场景以及说话人的特性,因此,利用上述训练样本对模型训练可以得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,所述根据判断结果确定所述语音数据对应的标签,包括:判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确;若所述判断结果表征所述语音检测模型对所述语音数据的检测准确,则确定所述标签为表征第一类型语音的标签或者第二类型语音的标签。在上述方案中,设备端在得到判断结果之后,若判断上述判断结果表征本地的语音检测模型对所述语音数据的检测准确,则可以直接根据判断结果确定语音数据的标签,从而可以利用确定的标签进一步的对本地的语音检测模型以及服务器的语音通用活体检测模型进行更新,以得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,所述判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确,包括:判断所述语音数据为所述第一类型语音或者所述第二类型语音的置信度是否大于预设阈值;若所述置信度大于所述预设阈值,则确定所述标签为表征所述第一类型语音的标签或者所述第二类型语音的标签。在上述方案中,设备端在得到判断结果之后,若判断语音数据为第一类型语音或者第二类型语音的置信度大于预设阈值,则可以直接根据判断结果确定语音数据的标签,从而可以利用确定的标签进一步的对本地的语音检测模型以及服务器的语音通用活体检测模型进行更新,以得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,在所述判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确之后,所述方法还包括:若所述判断结果表征所述语音检测模型对所述语音数据的检测不准确,则输出交互信息以核实所述语音数据为第一类型语音或者第二类型语音;接收根据所述交互信息返回的核实结果,并根据所述核实结果确定所述标签。在上述方案中,设备端在得到判断结果之后,若判断上述判断结果表征本地的语音检测模型对所述语音数据的检测不准确,则可以与用户交互辅助判断语音数据的类型,并采集语音数据以及用户判断结果,从而进一步的对语音检测模型以及服务器的语音通用活体检测模型进行更新,以得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,在所述存储所述语音数据以及所述标签作为样本数据之后,所述方法还包括:在存储的样本数据的数量超过预设计数阈值时,利用所述存储的样本数据对所述语音检测模型进行更新,并清零所述存储的样本数据的数量。在上述方案中,当存储的样本数据的数量超过预设技术阈值后对语音检测模型进行更新,从而在降低运算量的基础上得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,在所述存储所述语音数据以及所述标签作为样本数据之后,所述方法还包括:向所述服务器发送所述样本数据。在上述方案中,设备端可以将采集的样本数据发送给服务器,以使服务器可以对语音通用活体检测模型进行更新,以得到识别率更强的语音通用检测模型。在本申请的可选实施例中,所述第一类型语音为真人语音,所述第二类型语音为非真人语音。在上述方案中,语音检测模型可以进行活体检测,以判断语音数据为真人语音还是非真人语音。第二方面,本申请实施例提供一种模型更新方法,应用于服务器,包括:接收设备端发送的样本数据;根据所述样本数据对存储的语音通用检测模型进行更新。在上述方案中,服务器可以接收设备端采集的样本数据,从而可以对语音通用活体检测模型进行更新,以得到识别率更强的语音通用检测模型。在本申请的可选实施例中,在所述接收设备端发送的样本数据之前,所述方法还包括:获取语料库;利用所述语料库对预先建立好的机器学习模型进行训练,得到训练好的所述语音通用检测模型;向所述设备端发送所述语音通用检测模型,以使所述设备端部署所述语音通用检测模型并对所述语音通用检测模型进行自更新。在上述方案中,服务器可以利用语料库预先训练得到语音通用检测模型,并将语音通用检测模型下发给各个设备端,以使设备端可以利用语音通用检测模型进行语音检测。第三方面,本申请实施例提供一种模型更新装置,应用于设备端,包括:第一获取模块,用于获取语音数据;检测模块,用于利用部署在本地的语音检测模型对所述语音数据进行检测,以判断所述语音数据为第一类型语音或者第二类型语音;确定模块,用于根据判断结果确定所述语音数据对应的标签,并存储所述语音数据以及所述标签作为样本数据,以根据所述样本数据对所述语音检测模型以及部署在服务器上的语音通用活体检测模型进行更新。在上述方案中,设备端在部署语音检测模型之后,会采集该语音检测模型检测的语音数据以及对应的检测结果作为训练样本,进一步的对本地的语音检测模型以及服务器的语音通用活体检测模型进行更新。由于设备端采集的训练样本包含使用场景以及说话人的特性,因此,利用上述训练样本对模型训练可以得到更适应当前使用环境、识别率更强的语音检测模型。在本申请的可选实施例中,所述确定模块还用于:判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确;若所述判断结果表征所述语音检测模型对所述语音数据的检测准确,则确定所述标签为表征第一类型语音的标签或者第二类型语音的标签。在上述方案中,设备端在得到判断结果之后,若判断上述判断结果表征本地的语音检测模型对所述语音数据的检测准确,则可以直接根据判断结果确定语音数据的标签,从而可以利用确定的标签进一步的对本地的语音检测模型以及服务器的语本文档来自技高网...

【技术保护点】
1.一种模型更新方法,其特征在于,应用于设备端,包括:/n获取语音数据;/n利用部署在本地的语音检测模型对所述语音数据进行检测,以判断所述语音数据为第一类型语音或者第二类型语音;/n根据判断结果确定所述语音数据对应的标签,并存储所述语音数据以及所述标签作为样本数据,以根据所述样本数据对所述语音检测模型以及部署在服务器上的语音通用活体检测模型进行更新。/n

【技术特征摘要】
1.一种模型更新方法,其特征在于,应用于设备端,包括:
获取语音数据;
利用部署在本地的语音检测模型对所述语音数据进行检测,以判断所述语音数据为第一类型语音或者第二类型语音;
根据判断结果确定所述语音数据对应的标签,并存储所述语音数据以及所述标签作为样本数据,以根据所述样本数据对所述语音检测模型以及部署在服务器上的语音通用活体检测模型进行更新。


2.根据权利要求1所述的模型更新方法,其特征在于,所述根据判断结果确定所述语音数据对应的标签,包括:
判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确;
若所述判断结果表征所述语音检测模型对所述语音数据的检测准确,则确定所述标签为表征第一类型语音的标签或者第二类型语音的标签。


3.根据权利要求2所述的模型更新方法,其特征在于,所述判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确,包括:
判断所述语音数据为所述第一类型语音或者所述第二类型语音的置信度是否大于预设阈值;
若所述置信度大于所述预设阈值,则确定所述标签为表征所述第一类型语音的标签或者所述第二类型语音的标签。


4.根据权利要求2所述的模型更新方法,其特征在于,在所述判断所述判断结果是否表征所述语音检测模型对所述语音数据的检测不准确之后,所述方法还包括:
若所述判断结果表征所述语音检测模型对所述语音数据的检测不准确,则输出交互信息以核实所述语音数据为第一类型语音或者第二类型语音;
接收根据所述交互信息返回的核实结果,并根据所述核实结果确定所述标签。


5.根据权利要求1所述的模型更新方法,其特征在于,在所述存储所述语音数据以及所述标签作为样本数据之后,所述方法还包括:
在存储的样本数据的数量超过预设计数阈值时,利用所述存储的样本数据对所述语音检测模型进行更新,并清零所述存储的样本数据的数量。


6.根据权利要求1所述的模型更新方法,其特征在于,在所述存储所述语音数据以及所述标签作为样本数据之后,所述方法还包...

【专利技术属性】
技术研发人员:胡章一彭恒进
申请(专利权)人:四川虹微技术有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1