挖掘模型更新方法和装置制造方法及图纸

技术编号:15864105 阅读:30 留言:0更新日期:2017-07-23 08:51
本发明专利技术提出一种挖掘模型更新方法和装置,应用于语义解析系统中的挖掘模型,该挖掘模型更新方法包括获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:第一格式语料和第二格式语料;基于第一格式语料和第二格式语料对挖掘模型进行迭代更新;其中,第一格式语料用于标记查询语句中的语义特征,第二格式语料用于标记查询语句中的模板特征。通过本发明专利技术能够有效提升语义解析系统的语义解析效果。

【技术实现步骤摘要】
挖掘模型更新方法和装置
本专利技术涉及自然语言处理
,尤其涉及一种挖掘模型更新方法和装置。
技术介绍
随着自然语言处理技术的发展,相关技术中,在建立语义解析系统中的挖掘模型时,是由人工对线上数据进行分析,对相关的语义资源进行统计。这种方式下,语义解析系统的语义解析效果不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种挖掘模型更新方法,能够有效提升语义解析系统的语义解析效果。本专利技术的另一个目的在于提出一种挖掘模型更新装置。本专利技术的又一个目的在于提出一种挖掘模型更新装置。本专利技术的另一个目的在于提出一种非临时性计算机可读存储介质。本专利技术的另一个目的在于提出一种计算机程序产品。为达到上述目的,本专利技术第一方面实施例提出的挖掘模型更新方法,应用于语义解析系统中的挖掘模型,包括:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。本专利技术第一方面实施例提出的挖掘模型更新方法,通过获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果,并根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:用于标记查询语句中的语义特征的第一格式语料和用于标记查询语句中的模板特征第二格式语料,以及基于第一格式语料和第二格式语料对挖掘模型进行迭代更新,由于是根据对用户实际输入的查询语句进行解析得到的语义解析结果对挖掘模型进行迭代更新,后续基于更新后的挖掘模型所获取的语义资源丰富语义解析系统中,因而,能够有效提升语义解析系统的语义解析效果。为达到上述目的,本专利技术第二方面实施例提出的挖掘模型更新装置,应用于语义解析系统中的挖掘模型,包括:获取模块,用于获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;生成模块,用于根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;更新模块,用于基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。本专利技术第二方面实施例提出的挖掘模型更新装置,通过获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果,并根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:用于标记查询语句中的语义特征的第一格式语料和用于标记查询语句中的模板特征第二格式语料,以及基于第一格式语料和第二格式语料对挖掘模型进行迭代更新,由于是根据对用户实际输入的查询语句进行解析得到的语义解析结果对挖掘模型进行迭代更新,后续基于更新后的挖掘模型所获取的语义资源丰富语义解析系统中,因而,能够有效提升语义解析系统的语义解析效果。为达到上述目的,本专利技术第三方面实施例提出的挖掘模型更新装置,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。本专利技术第三方面实施例提出的挖掘模型更新装置,通过获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果,并根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:用于标记查询语句中的语义特征的第一格式语料和用于标记查询语句中的模板特征第二格式语料,以及基于第一格式语料和第二格式语料对挖掘模型进行迭代更新,由于是根据对用户实际输入的查询语句进行解析得到的语义解析结果对挖掘模型进行迭代更新,后续基于更新后的挖掘模型所获取的语义资源丰富语义解析系统中,因而,能够有效提升语义解析系统的语义解析效果。为达到上述目的,本专利技术第四方面实施例提出的非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种挖掘模型更新方法,所述方法包括:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。本专利技术第四方面实施例提出的非临时性计算机可读存储介质,通过获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果,并根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:用于标记查询语句中的语义特征的第一格式语料和用于标记查询语句中的模板特征第二格式语料,以及基于第一格式语料和第二格式语料对挖掘模型进行迭代更新,由于是根据对用户实际输入的查询语句进行解析得到的语义解析结果对挖掘模型进行迭代更新,后续基于更新后的挖掘模型所获取的语义资源丰富语义解析系统中,因而,能够有效提升语义解析系统的语义解析效果。为达到上述目的,本专利技术第五方面实施例提出的计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种挖掘模型更新方法,所述方法包括:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。本专利技术第五方面实施例提出的计算机程序产品,通过获取语义解析系统对用户输入的查询语句进行解析得到的语义解析结果,并根据语义解析结果生成对应的训练格式语料,其中,训练格式语料包括:用于标记查询语句中的语义特征的第一格式语料和用于标记查询语句中的模板特征第二格式语料,以及基于第一格式语料和第二格式语料对挖掘模型进行迭代更新,由于是根据对用户实际输入的查询语句进行解析得到的语义解析结果对挖掘模型进行迭代更新,后续基于更新后的挖掘模型所获取的语义资源丰富语义解析系统中,因而,能够有效提升语义解析系统的语义解析效果。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的挖掘模型更新方法的流程示意图;图2是本专利技术另一实施例提出的挖掘模型更新方法的流程示意图;图3是本专利技术另一实施例提出的挖掘模型更新方法的流程示意图;图4是本专利技术另一实施例提出的挖掘模型更新本文档来自技高网...
挖掘模型更新方法和装置

【技术保护点】
一种挖掘模型更新方法,其特征在于,应用于语义解析系统中的挖掘模型,包括:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。

【技术特征摘要】
1.一种挖掘模型更新方法,其特征在于,应用于语义解析系统中的挖掘模型,包括:获取所述语义解析系统对用户输入的查询语句进行解析得到的语义解析结果;根据所述语义解析结果生成对应的训练格式语料,其中,所述训练格式语料包括:第一格式语料和第二格式语料;基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新;其中,所述第一格式语料用于标记所述查询语句中的语义特征,所述第二格式语料用于标记所述查询语句中的模板特征。2.如权利要求1所述的挖掘模型更新方法,其特征在于,所述第一格式语料中包括:所述查询语句中分别与领域标签和意图标签对应的第一语义内容、多个槽位模板,以及与每个槽位模板对应的第二语义内容。3.如权利要求2所述的挖掘模型更新方法,其特征在于,所述根据所述语义解析结果生成对应的训练格式语料,包括:根据所述语义解析结果对所述查询语句进行分词,得到多个分词;将所述多个分词作为所述训练格式语料中的第一格式语料。4.如权利要求3所述的挖掘模型更新方法,其特征在于,所述第二格式语料中包括:多种槽位模板组合,及在每种槽位模板组合下对应的第二语义内容。5.如权利要求4所述的挖掘模型更新方法,其特征在于,所述根据所述语义解析结果生成对应的训练格式语料,包括:从所述第一格式语料中抽取所述多个槽位模板,以及与每个槽位模板对应的第二语义内容;生成所述多个槽位模板的各种排列组合,得到多种槽位模板组合;将所述多种槽位模板组合,及在每种槽位模板组合下对应的第二语义内容作为所述第二格式语料。6.如权利要求1所述的挖掘模型更新方法,其特征在于,在所述基于所述第一格式语料和第二格式语料对所述挖掘模型进行迭代更新之后,还包括:基于更新之前的挖掘模型对多个测试语句进行解析,得到第一解析结果;基于更新后的挖掘模型对所述多个测试语句进行解析,得到第二解析结果;根据预设模型评分规则对所述第一解析结果进行评分,得到第一分数,以及对所述第二解析结果进行评分,得到第二分数;在所述第二分数大于所述第一分数时,将所述更新后的挖掘模型作为所述语义解析系统的挖掘模型。7.一种挖掘模型更新装置,其特征在于,应用...

【专利技术属性】
技术研发人员:胡泽进
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1