语音数据的语义识别方法、装置、设备及存储介质制造方法及图纸

技术编号:33288488 阅读:68 留言:0更新日期:2022-05-01 00:02
本申请涉及人工智能技术领域,揭示了一种语音数据的语义识别方法、装置、介质及设备,其中方法包括:获取包含语义识别算法的初始识别模型,选取初始识别模型中的若干个隐藏神经元作为变量神经元,删除变量神经元形成第一识别模型;接收若干个训练样例,将训练样例分别输入第一识别模型的输入神经元中,并通过第一识别模型分别对训练样例进行语义识别,得到若干个第一识别结果;分别计算各第一识别结果对应的第一损失值,根据第一损失值对第一识别模型中语义识别算法的约束参数进行更新;通过目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果,从而实现了在数据量较小的情况下,提高语义识别的准确性。提高语义识别的准确性。提高语义识别的准确性。

【技术实现步骤摘要】
语音数据的语义识别方法、装置、设备及存储介质


[0001]本申请涉及到人工智能
,特别是涉及到一种语音数据的语义识别方法、装置、介质及设备。

技术介绍

[0002]智能客户、AI助手、人机对话等是AI科学重要的领域,然而在将AI应用于现实场景中时,就需要多个领域的系统协同配合才能模仿人类进行工作,在这种情况下,只有准确理解对方的语言所表达的含义,机器才能做出正确的响应。现有技术中,在对方答复的数据量较小的情况下,有可能导致模型的泛化能力不足,影响语音识别的准确度的问题,

技术实现思路

[0003]本申请的主要目的为提供一种语音数据的语义识别方法、装置、介质及设备,旨在解决现有技术中的在对方答复的数据量较小的情况下,难以准确进行语义识别的技术问题。
[0004]为了实现上述专利技术目的,本申请提出一种语音数据的语义识别方法,所述方法包括:
[0005]获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
[0006]接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
[0007]分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
[0008]将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
[0009]进一步的,所述根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,包括:
[0010]建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向;
[0011]根据所述梯度方向的反方向进行所述损失函数的权重更新,以使所述损失函数收敛,根据收敛后的所述损失函数求解所述约束参数,并根据求解的所述约束参数对所述第一识别模型进行更新。
[0012]进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,包括:
[0013]识别所述语音数据的语音序列,将所述语音序列与每一条预设的非正常序列分别进行相似度计算;
[0014]当每一个所述相似度均小于预设的相似阈值时,将所述语音数据输入目标识别模
型中,以使所述目标识别模型对所述语音数据进行语义识别。
[0015]进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
[0016]识别所述语音数据的空白数据;
[0017]在所述空白数据对应的位置添加分隔符,并删除所述空白数据,得到语音分隔数据;
[0018]将所述语音分隔数据输入所述目标识别模型,以使所述目标识别模型对所述语音分隔数据进行语义识别。
[0019]进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
[0020]将所述语音数据转换为文本数据,并通过预设的条件随机场分词模型对所述文本数据进行分词,得到若干个词语段落,其中,每一个所述词语段落分别包含至少一个语义;
[0021]通过所述目标识别模型,根据所述词语段落进行语义识别。
[0022]进一步的,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:
[0023]从云端服务器中获取通过第一密钥加密的加密源数据;
[0024]校验所述加密源数据的签名是否与解密密钥的签名匹配,若匹配,通过所述目标识别模型,对所述加密源数据解密后得到的所述语音数据进行语义识别。
[0025]进一步的,所述计算所述第一识别结果的对应的第一损失值,包括:
[0026]通过交叉熵损失函数,计算所述第一识别结果的对应的第一损失值。
[0027]本申请还提出了一种语音数据的语义识别装置,包括:
[0028]第一模型构建模块,用于获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;
[0029]第一语义识别模块,用于接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;
[0030]模型更新模块,用于分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;
[0031]第二语义识别模块,用于将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。
[0032]本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0033]本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
[0034]本申请的语音数据的语义识别方法、装置、介质及设备,通过对初始识别模型进行神经元随机删除,从而实现了约束简化,避免模型训练中过拟合的问题;通过随机删除隐藏
神经元之后的第一识别模型对训练样例进行识别,从而提高了第一识别结果的丰富度,降低了根据识别结果对第一识别模型进行训练的过拟合风险;通过第一损失值对当前的第一识别模型的识别准确度进行量化,从而对第一识别模型中的约束参数进行更新,从而得到识别准确度较高的识别模型,提高语义识别的准确度;通过将当前的第一识别模型作为目标识别模型,并将待识别的语音数据输入该目标识别模型的输入神经元之中,得到相应的语义识别结果,在语音数据有噪音的情况下,提升了模型的泛化能力,从而降低了对噪声数据的过拟合风险,提升了目标识别模型的语音意图识别能力,进而提高了目标识别模型进行语音识别的准确度。
附图说明
[0035]图1为本申请一实施例的语音数据的语义识别方法的流程示意图;
[0036]图2为本申请一实施例的语音数据的语义识别装置的结构示意框图;
[0037]图3为本申请一实施例的计算机设备的结构示意框图。
[0038]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0039]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0040]参照图1,本申请实施例中提供一种为了实现上述专利技术目的,本申请提出一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音数据的语义识别方法,其特征在于,所述方法包括:获取包含语义识别算法的初始识别模型,选取所述初始识别模型中的若干个隐藏神经元作为变量神经元,删除所述变量神经元形成第一识别模型;接收若干个训练样例,将所述训练样例分别输入所述第一识别模型的输入神经元中,并通过所述第一识别模型分别对所述训练样例进行语义识别,得到若干个第一识别结果;分别计算各所述第一识别结果对应的第一损失值,根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,并计算更新后的所述第一识别模型输出的所述第一识别结果对应的第一损失值,直至所述第一损失值均满足预设的损失范围;将更新后的所述第一识别模型作为目标识别模型,通过所述目标识别模型对接收到的语音数据进行语义识别,得到语义识别结果。2.根据权利要求1所述的语音数据的语义识别方法,其特征在于,所述根据所述第一损失值对所述第一识别模型中语义识别算法的约束参数进行更新,包括:建立与所述约束参数相关的损失函数,计算所述损失函数的梯度方向;根据所述梯度方向的反方向进行所述损失函数的权重更新,以使所述损失函数收敛,根据收敛后的所述损失函数求解所述约束参数,并根据求解的所述约束参数对所述第一识别模型进行更新。3.根据权利要求1所述的语音数据的语义识别方法,其特征在于,所述通过所述目标识别模型对接收到的语音数据进行语义识别,包括:识别所述语音数据的语音序列,将所述语音序列与每一条预设的非正常序列分别进行相似度计算;当每一个所述相似度均小于预设的相似阈值时,将所述语音数据输入目标识别模型中,以使所述目标识别模型对所述语音数据进行语义识别。4.根据权利要求1所述的语音数据的语义识别方法,其特征在于,所述通过所述目标识别模型对接收到的语音数据进行语义识别,还包括:识别所述语音数据的空白数据;在所述空白数据对应的位置添加分隔符,并删除所述空白数据,得到语音分隔数据;将所述语音分隔数据输入所述目标识别模型,以使所述目标识别模型对所述语音分隔数据进行语义识别。5.根据权利要求1所述的语音数据的语义识别方法,其特征在于,所述通过所述目标识别模型对接...

【专利技术属性】
技术研发人员:张稳
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1