一种语义模型的调优方法及系统技术方案

技术编号:22330141 阅读:34 留言:0更新日期:2019-10-19 12:17
本发明专利技术提供了一种语义模型的调优方法及系统,该方法包括:获取用户输入的文本信息;将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;根据所述目标语义标签及所述影响系数对所述语义模型进行调优。本发明专利技术实施例能够在待识别文本信息与语义识别结果出现匹配误差时,快速了解到是哪些数据导致了该匹配误差,从而对语义模型进行针对性的调优。

An optimization method and system of semantic model

【技术实现步骤摘要】
一种语义模型的调优方法及系统
本专利技术涉及语义识别
,尤其涉及一种语义模型的调优方法及系统。
技术介绍
如今,随着信息技术的深入发展,文本数据呈爆炸式增长态势,为了对这些文本数据进行充分的利用,许多场景都会应用到语义识别或语义匹配技术,例如:即时信息、微信公众号、机器人客服等等。现有的语义识别通常依赖于语义模型实现,该语义模型通过采用深度学习技术对用于训练的文本数据进行深度学习训练得到。在服务器获取到待识别文本信息时,将待识别文本信息输入到该语义模型中,最终输出与该待识别文本信息匹配度最高的语义识别结果。然而,由于深度学习技术复杂度较高,存在感知上的黑盒效应,即使主观上知道待识别文本信息与语义识别结果出现了明显的匹配误差,也无法快速了解到是哪些数据导致了该匹配误差,从而无法对语义模型进行针对性的调优。
技术实现思路
本专利技术提供了一种语义模型的调优方法及系统,以解决待识别文本信息与语义识别结果出现匹配误差时,无法快速了解到是哪些数据导致了该匹配误差,从而无法对语义模型进行针对性的调优的问题。为实现上述目的,本专利技术实施例第一方面提供了一种语义模型的调优方法,该方法包括:获取用户输入的文本信息;将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;根据所述目标语义标签及所述影响系数对所述语义模型进行调优。在一种可能的实施例中,在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前,所述方法还包括:获取标注数据集;将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。在一种可能的实施例中,所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。在一种可能的实施例中,所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。在一种可能的实施例中,根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。本专利技术实施例第二方面提供了一种语义模型的调优系统,该系统包括客户端及服务端,所述客户端和所述服务端通信连接;所述服务端包括第一获取模块、语义识别模块、第二获取模块及模型调优模块;所述客户端,用于接收用户输入的文本信息,并将所述文本信息发送至所述服务端;以及接收所述服务端返回的所述文本信息对应的目标语义标签;所述第一获取模块,用于接收所述文本信息;所述语义识别模块,用于将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;所述第二获取模块,用于获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;所述模型调优模块,用于根据所述目标语义标签及所述影响系数对所述语义模型进行调优。本专利技术实施例第三方面提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语义模型的调优方法中的步骤。本专利技术实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述语义模型的调优方法中的步骤。本专利技术的上述方案至少包括以下有益效果:本专利技术实施例通过获取用户输入的文本信息,然后将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,之后获取多个目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,最后根据所述影响系数的大小对目标语义标签下的多个所述目标标注数据进行排序并和目标语义标签一起输出,从而能够在语义识别结果与待识别文本信息不相匹配的情况下,快速了解到是哪些数据导致了匹配误差,进而对语义模型进行针对性的调优。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种网络架构的示意图;图2为本专利技术实施例提供的一种语义模型的调优方法的流程示意图;图3为本专利技术实施例提供的一种语义模型的结构示意图;图4为本专利技术实施例提供的另一种语义模型的调优方法的流程示意图;图5为本专利技术实施提供的一种语义模型的调优系统的结构意图;图6为本专利技术实施提供的另一种语义模型的调优系统的结构意图;图7为本专利技术实施提供的另一种语义模型的调优系统的结构意图;图8为本专利技术实施提供的另一种语义模型的调优系统的结构意图;图9为本专利技术实施提供的另一种语义模型的调优系统的结构意图;图10为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。本专利技术说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。首先结合相关附图来举例介绍下本申请实施例的方案可能的网络架构,请参见图1,图1为本专利技术实施例提供的一种网络架构的示意图,如图1所示,具体涉及到用户终端及服务器,二者通过网络通信连接,实现交互。用户终端用于接收用户通过输入界面输入的文本信息,例如:我不记得密码了怎么办?用户终本文档来自技高网
...

【技术保护点】
1.一种语义模型的调优方法,其特征在于,所述方法包括:获取用户输入的文本信息;将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;根据所述目标语义标签及所述影响系数对所述语义模型进行调优。

【技术特征摘要】
1.一种语义模型的调优方法,其特征在于,所述方法包括:获取用户输入的文本信息;将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;根据所述目标语义标签及所述影响系数对所述语义模型进行调优。2.根据权利要求1所述的方法,其特征在于,在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前,所述方法还包括:获取标注数据集;将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。3.根据权利要求2所述的方法,其特征在于,所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。4.根据权利要求1所述的方法,其特征在于,所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。5.根据权利要求1或4所述的方法,其特征在于,所述根据所述目标语义标签及所述影响系数对所述语义模型进行调优,包括:根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。6.一种语义模型的调优系统,其特征在于,所述系统包括客户端及服务端,所述客户端和所述服务端通信连接;所述服务端包括第一获取模块、语义...

【专利技术属性】
技术研发人员:林道智
申请(专利权)人:深圳追一科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1