自然语言处理模型的场景适配方法、装置、设备及介质制造方法及图纸

技术编号:37459857 阅读:27 留言:0更新日期:2023-05-06 09:32
本公开提供了一种自然语言处理模型的场景适配方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及自然语言处理技术领域。具体实现方案为:获取目标场景下的目标语音数据集;根据目标语音数据集确定初始自然语言处理模型,并根据初始自然语言处理模型确定目标语音数据输入向量以及至少一个参考语音数据输入向量;依次将目标语音数据输入向量输入至与初始自然语言处理模型对应的初始拓扑网络的各网络节点中,得到与初始自然语言处理模型对应的目标拓扑网络;分别将各参考语音数据输入向量输入至目标拓扑网络中,得到适配于目标场景的目标自然语言处理模型。本公开的方案使自然语言处理模型与场景紧密适配,提升了自然语言处理模型的精度。言处理模型的精度。言处理模型的精度。

【技术实现步骤摘要】
自然语言处理模型的场景适配方法、装置、设备及介质


[0001]本公开涉及人工智能
,尤其涉及自然语言处理
,具体涉及一种自然语言处理模型的场景适配方法、装置、设备及介质。

技术介绍

[0002]随着人工智能技术的不断发展以及广泛应用,自然语言处理技术也得到了广泛地应用,诸如智能音箱、车载语音助手以及智能机器人等不同设备以及应用场景中都涉及到了自然语言处理技术的应用;同时,通过自然语言处理模型也可以加快自然语言处理的速度以及精度。

技术实现思路

[0003]本公开提供了一种自然语言处理模型的场景适配方法、装置、设备及介质。
[0004]根据本公开的一方面,提供了一种自然语言处理模型的场景适配方法,包括:
[0005]获取目标场景下的目标语音数据集;所述目标语音数据集包括多个语音数据,且各所述语音数据的尺寸描述参数满足预设条件;
[0006]根据所述目标语音数据集确定初始自然语言处理模型,并根据所述初始自然语言处理模型确定目标语音数据输入向量以及至少一个参考语音数据输入向量;<br/>[0007]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自然语言处理模型的场景适配方法,包括:获取目标场景下的目标语音数据集;所述目标语音数据集包括多个语音数据,且各所述语音数据的尺寸描述参数满足预设条件;根据所述目标语音数据集确定初始自然语言处理模型,并根据所述初始自然语言处理模型确定目标语音数据输入向量以及至少一个参考语音数据输入向量;依次将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的各网络节点中,得到与所述初始自然语言处理模型对应的目标拓扑网络;分别将各所述参考语音数据输入向量输入至所述目标拓扑网络中,得到适配于所述目标场景的目标自然语言处理模型。2.根据权利要求1所述的方法,其特征在于,所述获取目标场景下的目标语音数据集,包括:在所述目标场景中实时获取语音数据,并确定各所述语音数据的尺寸描述参数;根据各所述尺寸描述参数对各所述语音数据进行筛选,得到所述目标语音数据集;所述目标场景包括:智能问答场景或者语音播报场景。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音数据集确定初始自然语言处理模型,包括:根据所述目标语音数据集的属性特征,组网得到所述初始自然语言处理模型;所述目标语音数据集的属性特征,包括:语音数据的类型或者各所述语音数据的尺寸描述参数。4.根据权利要求3所述的方法,其特征在于,所述根据所述初始自然语言处理模型确定目标语音数据输入向量以及至少一个参考语音数据输入向量,包括:在目标运行环境运行所述初始自然语言处理模型,并在所述初始自然语言处理模型的运行过程中获取维度在预设范围内的语音数据的尺寸描述参数;将各所述尺寸描述参数写入目标文件中,得到初始化文件;遍历所述初始化文件中的各尺寸描述参数,确定各所述尺寸描述参数的出现频率;将出现频率大于第一设定阈值的目标尺寸描述参数对应的目标语音数据确定为目标语音数据输入向量;将出现频率大于第二设定阈值的目标尺寸描述参数对应的目标语音数据确定为各所述参考语音数据输入向量;其中,所述第一设定阈值大于所述第二设定阈值。5.根据权利要求1所述的方法,其中,所述依次将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的各网络节点中,得到与所述初始自然语言处理模型对应的目标拓扑网络,包括:依次将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的各网络节点中,分别得到与各所述网络节点对应的至少一个处理结果;分别对与各所述网络节点对应的各所述处理结果进行筛选,得到与各所述网络节点对应的目标算子,形成与所述初始自然语言处理模型对应的目标拓扑网络。6.根据权利要求5所述的方法,其中,所述依次将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的各网络节点中,分别得到与各所述网络
节点对应的至少一个处理结果,包括:将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的第一个网络节点中,得到至少一个第一输出结果,并对各所述第一输出结果进行筛选,得到至少一个目标第一输出结果;继续执行将所述目标语音数据输入向量输入至与所述初始自然语言处理模型对应的初始拓扑网络的下一个网络节点的操作,直至所述初始自然语言处理模型对应的初始拓扑网络的最后一个网络节点,得到筛选后的至少一个目标输出结果为止。7.根据权利要求6所述的方法,其中,各所述第一输出结果包括数据类型、数据形式以及处理时长;所述对各所述第一输出结果进行筛选,得到至少一个目标第一输出结果,包括:在各所述第一输出结果的数据类型相同的情况下,滤除数据形式相同,且处理时长满足预设时长规则的第一输出结果;或者,在各所述第一输出结果的数据类型不相同的情况下,滤除数据类型以及数据形式相同,且处理时长满足预设时长规则的第一输出结果。8.根据权利要求5所述的方法,其中,所述分别对与各所述网络节点对应的各所述处理结果进行筛选,得到与各所述网络节点对应的目标算子,形成与所述初始自然语言处理模型对应的目标拓扑网络,包括:确定各所述目标第一输出结果的处理时长,依据各所述处理时长按照设定顺序对各所述目标第一输出结果进行排序,获取排在序列首位或者末位的第一输出结果对应的算子,并将所述算子确定为与第一个网络节点对应的第一目标算子;或者,确定各目标输出结果的数据形式,在第一目标输出结果的目标数据形式与目标语音数据输入向量的数据形式不同的情况下,将所述第一目标输出结果的目标数据形式转换成所述目标语音数据输入向量的数据形式,并获取转换时长,将所述第一目标输出结果的处理时长加上转速时长,得到与所述第一目标输出结果对应的目标时长;依据各所述目标时长按照设定顺序对各所述目标输出结果进行排序,获取排在序列首位或者末位的目标输出结果对应的算子,并将所述算子确定为与最后一个网络节点对应的目标算子;根据各所述目标算子,形成与所述初始自然语言处理模型对应的目标拓扑网络;其中,每个所述目标算子包含至少一个处理内核。9.根据权利要求1所述的方法,其中,所述分别将各所述参考语音数据输入向量输入至所述目标拓扑网络中,得到适配于所述目标场景的目标自然语言处理模型,包括:依次将各所述参考语音数据输入向量输入至所述目标拓扑网络中的第一网络节点中,依次通过所述第一网络节点的目标算子中的各处理内核对参考语音数据输入向量进行处理,并根据处理结果确定与所述第一网络节点的目标算子对应的第一目标处理内核;继续执行将参考向量输入至所述目标拓扑网络中的下一网络节点中的操作,直至所述目标拓扑网络中的最后一个网络节点,得到与所述最后一个网络节点的目标算子对应的目标处理内核为止;根据与各网络节点对应的目标处理内核以及目标拓扑网络,得到适配于所述目标场景的目标自然语言处理模型。
10.根据权利要求9所述的方法,其中,所述根据处理结果确定与所述第一网络节点的目标算子对应的第一目标处理内核,包括:确定目标算子中各处理内核处理所述参考语音数据输入向量的所需时长;按照设定顺序对各所述所需时长进行排序,将满足设定阈值的所需时长对应的处理内核确定为第一目标处理内核。11.根据权利要求9所述的方法,其中,所述根据与各网络节点对应的目标处理内核以及目标拓扑网络,得到适配于所述目标场景的目标自然语言处理模型,包括:滤除所述目标拓扑网络中,除各所述目标处理内核外的其他参考处理内核,得到适配于所述目标场景的目标自然语言处理模型。12.一种自然语言处理模型的场景适配的装置,包括:目标语音...

【专利技术属性】
技术研发人员:周康康
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1